1. Prodotti
  2.   Conholdate.Total
  3.   Java
  4.   Convertir PDF en XML en Java

Convertir PDF en XML en Java

Convertissez des fichiers PDF en XML dans les applications Java grâce à notre API flexible de conversion de documents PDF pour manipuler l’apparence du document XML converti en fonction de vos besoins. La bibliothèque de conversion PDF permet la conversion PDF vers une variété de formats, notamment des documents de traitement Word, des feuilles de calcul Excel, des présentations PowerPoint, Photoshop, des livres électroniques, du Web et des images. Convertissez facilement l’intégralité du PDF ou sélectionnez des pages spécifiques en fonction des numéros de page ou des plages. Essayez dès aujourd’hui gratuitement l’API PDF Converter et notre outil de conversion PDF en XML en ligne.

Scarica

Comment convertir PDF en XML en Java

Effectuez la conversion de fichiers PDF en fichiers XML en Java en trois étapes simples. En utilisant l’exemple de code ci-dessous, affichez le document converti tel qu’il est ou rendez-le davantage pour l’afficher sous forme de fichier HTML sans installer de logiciel externe.

Obtenez les fichiers d’assemblage respectifs à partir des téléchargements ou récupérez l’ensemble du package à partir de Maven pour ajoutez Conholdate.Total directement dans votre espace de travail.

  • Créez une nouvelle instance de la classe Converter et chargez le fichier PDF
  • Définissez ConvertOptions pour le type de fichier XML
  • Appelez la méthode Convert de l’instance de classe Converter pour la conversion en XML
  • Définir les options du visualiseur HTML
  • Créez un objet Viewer pour afficher le XML converti au format HTML

Application gratuite pour la conversion de PDF à XML



Convertir des PDF en documents Word en Java

Il devient plus facile de convertir des documents PDF en documents Word en Java d’applications à l’aide des API Conholdate.Total. Le fichier PDF se transforme parfaitement en fichier Word (DOCX) et prend en charge un ensemble supplémentaire de fonctionnalités de formatage de document pour personnaliser la mise en page du fichier de sortie en fonction de vos besoins. Vous pouvez facilement modifier le contenu tel que le texte, les tableaux, les images et les listes du document Word converti.

  • Créez une nouvelle instance de la classe Converter et chargez PDF en tant que fichier d’entrée
  • Instanciez WordProcessingConvertOptions comme option de conversion
  • Appelez la méthode Convert de l’instance de classe Converter pour la conversion en DOCX

Extraction d'informations sur les documents PDF

La fonction d’extraction d’informations sur les documents permet non seulement d’obtenir les informations de base sur le fichier du document source, mais elle prend également en charge l’extraction de certaines informations précieuses spécifiques au format de fichier, telles que les dates de début et de fin du projet d’un fichier Microsoft Project, toute restriction d’impression sur un document PDF, liste des dossiers contenus dans un fichier de données Outlook, etc.

Convertissez les formats de fichiers de documents populaires sur différents systèmes d’exploitation tels que Windows, Linux ou macOS tout en utilisant des environnements de développement tels que NetBeans, IntelliJ IDEA et Eclipse.


Convertir PDF en Excel en Java

Convertir des feuilles de calcul PDF en Excel en utilisant quelques lignes de code Java. Le contenu d’un fichier PDF est converti en lignes et en colonnes d’une feuille de calcul Excel qui peut être modifiée facilement selon vos besoins. Un fichier PDF peut être converti dans ces formats de feuille de calcul (XLS, XLSX, XLSM, XLSB, XLTX, XLT), OpenDocument (ODS, OTS) et Apple iWork Numbers.

  • Créez une nouvelle instance de la classe Converter et chargez PDF en tant que fichier d’entrée
  • Instanciez SpreadsheetConvertOptions comme option de conversion
  • Appelez la méthode Convert de l’instance de classe Converter pour la conversion en XLSX

Mise en cache des résultats du document XML

Dans certains cas, la taille du document converti est plus grande et la conversion prend du temps. La bibliothèque de conversion de documents offre la fonction de mise en cache pour gérer efficacement de telles situations et accélérer le processus de conversion répétitif. Activez l’interface ICache pour qu’elle fonctionne avec l’implémentation du cache personnalisé à l’aide du point d’extension et contrôlez la conversion du cache, comme vous le souhaitez.

Le résultat de la conversion est enregistré sur le lecteur local par défaut, mais tout type de stockage de cache peut être pris en charge en implémentant les interfaces appropriées telles qu’Amazon S3, Dropbox, Google Drive, Windows Azure, Reddis ou tout autre.


Convertir PDF en PowerPoint en Java

Convertir PDF en PowerPoint (PPT, PPTX) les diapositives sont plus rapides avec Conholdate.Total pour les API Java. Une fois convertis, vous pouvez facilement modifier les présentations PowerPoint et les diapositives dans Microsoft PowerPoint.

  • Créez une nouvelle instance de la classe Converter et chargez PDF en tant que fichier d’entrée
  • Instanciez PresentationConvertOptions comme option de conversion
  • Appelez la méthode Convert de l’instance de classe Converter pour la conversion en PPTX

Charger et convertir des PDF situés à distance

À l’aide de Conholdate.Total pour Java, les développeurs peuvent charger et convertir des PDF et d’autres documents à partir de divers emplacements distants et de ressources de stockage de documents dans le cloud telles qu’Amazon S3, Microsoft Azure Blob, FTP, un disque local, un flux ou une simple URL. Il vous suffit de spécifier la méthode pour obtenir un flux de documents localisé à distance puis de le transmettre à la classe Converter en tant que constructeur.

La bibliothèque de conversion Java PDF prend également en charge le chargement et la conversion de documents protégés par un mot de passe dans vos applications Java.


Convertir un PDF en images en Java

Convertir PDF en image formats tels que JPG, PNG, GIF, BMP, TIFF et bien d’autres avec une qualité d’image précise et résolution. Transformez l’intégralité du fichier PDF ou choisissez parmi certaines pages sélectionnées à convertir en images.

  • Créez une nouvelle instance de la classe Converter et chargez PDF en tant que fichier d’entrée
  • Déclarez le délégué SavePageStream pour enregistrer la page de document convertie dans le flux
  • Spécifiez JPG comme format de sortie souhaité en lui transmettant l’objet ImageConvertOptions
  • Appelez la méthode Convert de l’instance de classe Converter pour la conversion en JPG

Ajouter des filigranes de texte ou d'image au PDF

Convertissez avec précision les documents exactement comme le fichier d’origine et ajoutez un filigrane de texte ou d’image au PDF et d’autres formats de document pris en charge. Tamponnez intelligemment les filigranes à l’aide d’un ensemble d’options de filigrane pour gérer la police, la couleur, la largeur, la hauteur, l’angle de rotation, la transparence et placer le filigrane en arrière-plan des pages du document.

La détection automatique du format du document source est une autre fonctionnalité utile pour récupérer l’extension de fichier elle-même dans certains cas où le fichier source est présenté sous la forme d’un flux d’octets. Les développeurs peuvent également obtenir une liste complète de tous les formats de conversion pris en charge lors de la conversion d’un document vers un autre format de fichier en appelant la méthode GetPossibleConversions de l’objet Converter.


Qu'est-ce que le format de fichier PDF?

PDF (Portable Document Format) est un format de fichier de document développé par Adobe Systems en 1993. Il a été conçu pour fournir un moyen indépendant de la plate-forme de stocker et de partager des documents, sur différents systèmes d’exploitation et sur Internet. Les fichiers PDF utilisent un modèle de dessin vectoriel, ce qui signifie qu’ils stockent des éléments graphiques (lignes, formes, images, etc.) sous forme d’équations mathématiques. Ceci, à son tour, rend les PDF indépendants de la résolution, ce qui signifie que la qualité du document reste constante quel que soit le type d’appareil ou de programme dans lequel il est visualisé. Les PDF prennent également en charge un certain nombre de fonctions de sécurité, telles que le cryptage, la protection par mot de passe, les signatures numériques. , et filigrane de document. Les PDF sont désormais l’un des moyens les plus populaires de partager des documents. Ils sont utilisés dans une variété d’occasions, y compris les documents médicaux et juridiques, les formulaires gouvernementaux et les factures. De plus, ils sont utilisés dans l’industrie de l’imprimerie pour communiquer électroniquement avec les clients. Les PDF peuvent être créés à partir de n’importe quel type de document électronique, y compris des documents Word, des présentations PowerPoint et des pages Web. Il est important de noter, cependant, que les PDF ne sont pas modifiables. Pour apporter des modifications à un PDF, il doit d’abord être converti dans un format de fichier différent. Il existe un certain nombre de logiciels disponibles pour ce faire, dont la plupart sont téléchargeables gratuitement.

Apprendre

Qu'est-ce que le format de fichier XML?

XML (eXtensible Markup Language) est un format de fichier utilisé pour stocker des données de manière structurée et organisée. C’est un langage de balisage, similaire au HTML, qui utilise des balises pour identifier les éléments. Les fichiers XML peuvent être lus et écrits par n’importe quel programme prenant en charge cette norme. Le principal avantage de l’utilisation de XML est qu’il permet de stocker les données d’une manière lisible à la fois par l’homme et par la machine. Les fichiers XML sont devenus de plus en plus populaires ces dernières années en raison de leur polyvalence et de leur facilité d’utilisation. Ils peuvent être utilisés pour stocker de grandes quantités de données de manière organisée, et peuvent également être utilisés pour créer des documents et des pages Web. Les fichiers XML peuvent être édités et mis à jour rapidement et facilement. Ils sont également faciles à analyser et à extraire des données, ce qui signifie que les informations peuvent être rapidement extraites et utilisées dans d’autres applications. Dans l’ensemble, XML est un outil inestimable pour stocker des données de manière structurée et organisée. C’est une partie essentielle de nombreuses applications modernes et son utilisation est susceptible de continuer à se développer dans les années à venir.

Apprendre

Options de conversion PDF populaires avec Java

Convertir PDF à DOC

(Format binaire Microsoft Word)

Convertir PDF à DOCX

(Office 2007+ Document Word)

Convertir PDF à DOCM

(Fichier Marco Microsoft Word 2007)

Convertir PDF à DOT

(Fichiers de modèle Microsoft Word)

Convertir PDF à DOTX

(Fichier de modèle Microsoft Word)

Convertir PDF à DOTM

(Fichier de modèle Microsoft Word 2007+)

Convertir PDF à TXT

(Document texte)

Convertir PDF à RTF

(Format de texte enrichi)

Convertir PDF à HTML

(Langage Signalétique Hyper Text)

Convertir PDF à HTM

(Fichier de langage de balisage hypertexte)

Convertir PDF à MHTML

(Format d'archivage des pages Web)

Convertir PDF à MHT

(Archives Web MHTML)

Convertir PDF à XLS

(Feuille de calcul Microsoft Excel (ancienne version))

Convertir PDF à XLSX

(Ouvrir le classeur XML)

Convertir PDF à XLSM

(Feuille de calcul prenant en charge les macros)

Convertir PDF à XLSB

(Classeur binaire Excel)

Convertir PDF à XLT

(Excel 97 - Modèle 2003)

Convertir PDF à XLTX

(Modèle Excel)

Convertir PDF à XLTM

(Modèle Excel compatible avec les macros)

Convertir PDF à XLAM

(Complément Excel prenant en charge les macros)

Convertir PDF à CSV

(Valeurs séparées par des virgules)

Convertir PDF à TSV

(Valeurs séparées par des tabulations)

Convertir PDF à DIF

(Format d'échange de données)

Convertir PDF à SXC

(Feuille de calcul StarOffice Calc)

Convertir PDF à FODS

(Feuille de calcul XML plate OpenDocument)

Convertir PDF à PPT

(Microsoft PowerPoint 97-2003)

Convertir PDF à PPTX

(Format de présentation XML ouvert)

Convertir PDF à PPTM

(Fichier de présentation prenant en charge les macros)

Convertir PDF à PPS

(Diaporama PowerPoint)

Convertir PDF à PPSX

(Diaporama PowerPoint)

Convertir PDF à PPSM

(Diaporama compatible avec les macros)

Convertir PDF à POT

(Fichiers de modèle Microsoft PowerPoint)

Convertir PDF à POTX

(Modèle de présentation Microsoft PowerPoint)

Convertir PDF à POTM

(Fichier de modèle Microsoft PowerPoint)

Convertir PDF à ODT

(Format de fichier texte OpenDocument)

Convertir PDF à OTT

(Format standard OpenDocument)

Convertir PDF à OTP

(Format standard OpenDocument)

Convertir PDF à ODP

(Format de présentation OpenDocument)

Convertir PDF à ODS

(Feuille de calcul OpenDocument)

Convertir PDF à EMZ

(Métafichier amélioré compressé Windows)

Convertir PDF à WMZ

(Métafichier Windows compressé)

Convertir PDF à SVG

(Graphiques vectoriels scalaires)

Convertir PDF à SVGZ

(Graphiques vectoriels évolutifs compressés)

Convertir PDF à XPS

(Spécifications papier XML)

Convertir PDF à TEX

(Document source LaTeX)

Convertir PDF à WMF

(Métafichier Windows)

Convertir PDF à EMF

(Format de métafichier amélioré)

Convertir PDF à BMP

(Fichier image bitmap)

Convertir PDF à PNG

(Graphique réseau portable)

Convertir PDF à GIF

(Format d'échange graphique)

Convertir PDF à JPEG

(Image du Groupe conjoint d'experts en photographie)

Convertir PDF à TIFF

(Format de fichier d'image balisé)

Convertir PDF à ICO

(Fichier d'icônes)

Convertir PDF à WEBP

(Format d'image Web raster)

Convertir PDF à JP2

(Image de base JPEG 2000)

Convertir PDF à TGA

(Adaptateur graphique Truevision)

Convertir PDF à PSB

(Grand format de document Photoshop)

Convertir PDF à PSD

(Document Photoshop)

Convertir PDF à EPUB

(Ouvrir le fichier de livre électronique)

Convertir PDF à MD

(Langage Markdown)

Convertir PDF à DICOM

(Imagerie numérique et communications en médecine)

Convertir PDF à FODP

(Présentation du document ouvert)

Convertir PDF à JPG

(Image du Groupe conjoint d'experts en photographie)

Convertir PDF à ZIP

(Fichier compressé)

Convertir PDF à JSON

(Fichier de notation d'objet JavaScript)

Convertir PDF à DXF

(Format d'échange de dessins Autodesk)

 Français