1. productos
  2.   Conholdate.Total
  3.   Java
  4.   Convertir PDF a XML en Java

Convertir PDF a XML en Java

Convierta archivos PDF a XML en aplicaciones Java con nuestra API flexible de conversión de documentos PDF para manipular la apariencia del documento XML convertido que se ajuste a sus necesidades. La biblioteca de conversión de PDF ofrece conversión de PDF a una variedad de formatos, incluidos documentos de procesamiento de Word, hojas de cálculo de Excel, presentaciones de PowerPoint, Photoshop, libros electrónicos, web e imágenes. Convierta fácilmente el PDF completo o seleccione páginas específicas según los números o rangos de páginas. Pruebe la API PDF Converter y nuestra herramienta de conversión de PDF a XML en línea hoy de forma gratuita.

Descargar

Cómo convertir PDF a XML en Java

Realice la conversión de archivos PDF a archivos XML en Java usando tres sencillos pasos. Usando el ejemplo de código a continuación: vea el documento convertido tal como está o reprodúzcalo para verlo como un archivo HTML sin instalar ningún software externo.

Obtenga los archivos de ensamblaje respectivos de descargas o obtenga el paquete completo de Maven para agregue Conholdate.Total directamente en su espacio de trabajo.

  • Cree una nueva instancia de la clase Converter y cargue el archivo PDF
  • Configure ConvertOptions para el tipo de archivo XML
  • Llame al método Convert de la instancia de la clase Converter para la conversión a XML
  • Establecer opciones para el visor HTML
  • Cree un objeto Viewer para ver XML convertido como HTML

Aplicación gratuita para conversión de PDF a XML



Convertir documentos PDF a Word en Java

Se vuelve más fácil convertir documentos PDF a Word en Java aplicaciones usando Conholdate.Total API. El archivo PDF se transforma perfectamente en un archivo de Word (DOCX) y es compatible con un conjunto adicional de funciones de formato de documentos para personalizar el diseño del archivo de salida según sus necesidades. Puede editar fácilmente el contenido, como texto, tablas, imágenes y listas del documento de Word convertido.

  • Cree una nueva instancia de la clase Converter y cargue PDF como archivo de entrada
  • Crear una instancia de WordProcessingConvertOptions como la opción de conversión
  • Llame al método Convert de la instancia de la clase Converter para la conversión a DOCX

PDF Extracción de información de documentos

La función de extracción de información de documentos no solo permite obtener la información básica sobre el archivo del documento de origen, sino que también admite la extracción de información valiosa específica del formato de archivo, como las fechas de inicio y finalización del proyecto de un archivo de Microsoft Project, cualquier restricción de impresión en un documento PDF, lista de carpetas encerradas en un archivo de datos de Outlook, etc.

Convierta formatos de archivo de documentos populares en diferentes sistemas operativos como Windows, Linux o macOS mientras usa entornos de desarrollo como NetBeans, IntelliJ IDEA y Eclipse.


Convertir PDF a Excel en Java

Convierta hojas de cálculo de PDF a Excel utilizando unas pocas líneas de código Java. El contenido de un archivo PDF se convierte en filas y columnas de una hoja de cálculo de Excel que se puede editar fácilmente según lo requiera. Un archivo PDF se puede convertir a estos formatos de hoja de cálculo (XLS, XLSX, XLSM, XLSB, XLTX, XLT), OpenDocument (ODS, OTS) y Apple iWork Numbers.

  • Cree una nueva instancia de la clase Converter y cargue PDF como archivo de entrada
  • Crea una instancia de SpreadsheetConvertOptions como la opción de conversión
  • Llame al método Convert de la instancia de la clase Converter para la conversión a XLSX

Almacenamiento en caché de resultados de documentos XML

En algunos casos, el tamaño del documento convertido es mayor y lleva tiempo convertirlo. La biblioteca de conversión de documentos ofrece la función de almacenamiento en caché para administrar de manera eficiente tales situaciones y acelerar el proceso de conversión repetitivo. Habilite la interfaz de ICache para que funcione con la implementación de caché personalizada utilizando el punto de extensión y controle la conversión de caché, como prefiera.

El resultado de la conversión se guarda en la unidad local de forma predeterminada, pero se puede admitir cualquier tipo de almacenamiento en caché implementando las interfaces adecuadas, como Amazon S3, Dropbox, Google Drive, Windows Azure, Reddis o cualquier otra.


Convertir PDF a PowerPoint en Java

Convertir PDF a PowerPoint (PPT, PPTX) diapositivas es más rápido con Conholdate.Total para las API de Java. Una vez convertido, puede editar fácilmente las presentaciones y diapositivas de PowerPoint en Microsoft PowerPoint.

  • Cree una nueva instancia de la clase Converter y cargue PDF como archivo de entrada
  • Crear una instancia de PresentationConvertOptions como la opción de conversión
  • Llame al método Convert de la instancia de la clase Converter para la conversión a PPTX

Cargar y convertir PDF ubicado de forma remota

Usando Conholdate.Total para Java, los desarrolladores pueden cargar y convertir PDF y otros documentos desde varias ubicaciones remotas y recursos de almacenamiento de documentos en la nube, como Amazon S3, Microsoft Azure Blob, FTP, disco local, transmisión o una simple URL. Sólo tiene que especificar el método para obtener el flujo de documentos ubicado de forma remota y luego pasarlo a la clase Converter como constructor.

La biblioteca de conversión de PDF de Java también admite la carga y conversión de documentos que están protegidos con una contraseña dentro de sus aplicaciones basadas en Java.


Convertir PDF a Imágenes en Java

Convertir PDF a imagen formatos como JPG, PNG, GIF, BMP, TIFF y muchos otros con una calidad de imagen precisa y resolución. Transforme todo el archivo PDF o elija entre algunas páginas seleccionadas para convertirlas en imágenes.

  • Cree una nueva instancia de la clase Converter y cargue PDF como archivo de entrada
  • Declare SavePageStream delegado para guardar la página del documento convertido en flujo
  • Especifique JPG como el formato de salida deseado pasándole el objeto ImageConvertOptions
  • Llame al método Convert de la instancia de la clase Converter para la conversión a JPG

Agregar marcas de agua de texto o imagen a PDF

Convierta documentos con precisión exactamente como el archivo original y agregue una marca de agua de texto o imagen a PDF y otros formatos de documentos compatibles. Selle las marcas de agua de manera inteligente utilizando un conjunto de opciones de marcas de agua para administrar la fuente, el color, el ancho, la altura, el ángulo de rotación, la transparencia y colocar la marca de agua en el fondo de las páginas del documento.

La detección automática del formato del documento de origen es otra función útil para recuperar la extensión del archivo en algunos casos en los que el archivo de origen se presenta en forma de flujo de bytes. Los desarrolladores también pueden obtener una lista completa de todos los formatos de conversión admitidos al convertir un documento a otro formato de archivo llamando al método GetPossibleConversions del objeto Converter.


Qué es el formato de archivo PDF?

PDF (formato de documento portátil) es un formato de archivo de documento que fue desarrollado por Adobe Systems en 1993. Fue diseñado para proporcionar una forma independiente de plataforma de almacenar y compartir documentos, a través de diferentes sistemas operativos ya través de Internet. Los archivos PDF utilizan un modelo de dibujo basado en vectores, lo que significa que almacena elementos gráficos (líneas, formas, imágenes, etc.) como ecuaciones matemáticas. Esto, a su vez, hace que la resolución de los PDF sea independiente, lo que significa que la calidad del documento se mantiene constante sin importar el tipo de dispositivo o programa en el que se visualice. Los PDF también admiten una serie de funciones de seguridad, como cifrado, protección con contraseña, firmas digitales y marca de agua del documento. Los archivos PDF son ahora una de las formas más populares de compartir documentos. Se utilizan en una variedad de ocasiones, incluidos documentos médicos y legales, formularios gubernamentales y facturas. Además, se utilizan en la industria de la impresión para comunicarse electrónicamente con los clientes. Los archivos PDF se pueden crear a partir de cualquier tipo de documento electrónico, incluidos documentos de Word, presentaciones de PowerPoint y páginas web. Sin embargo, es importante tener en cuenta que los archivos PDF no son editables. Para realizar cambios en un PDF, primero debe convertirse a un formato de archivo diferente. Hay una serie de programas de software disponibles para hacer esto, la mayoría de los cuales se pueden descargar gratis.

Aprender

Qué es el formato de archivo XML?

XML (lenguaje de marcado extensible) es un formato de archivo que se utiliza para almacenar datos de forma estructurada y organizada. Es un lenguaje de marcas, similar a HTML, que utiliza etiquetas para identificar elementos. Cualquier programa compatible con este estándar puede leer y escribir archivos XML. El principal beneficio de usar XML es que permite que los datos se almacenen de una manera que sea legible tanto por humanos como por máquinas. Los archivos XML se han vuelto cada vez más populares en los últimos años debido a su versatilidad y facilidad de uso. Se pueden usar para almacenar grandes cantidades de datos de manera organizada y también se pueden usar para crear documentos y páginas web. Los archivos XML se pueden editar y actualizar rápida y fácilmente. También son fáciles de analizar y extraer datos, lo que significa que la información se puede extraer y utilizar rápidamente en otras aplicaciones. En general, XML es una herramienta invaluable para almacenar datos de manera estructurada y organizada. Es una parte esencial de muchas aplicaciones modernas y es probable que su uso continúe creciendo en los próximos años.

Aprender

Opciones de conversión populares de PDF con Java

Convertir PDF para DOC

(Formato binario de Microsoft Word)

Convertir PDF para DOCX

(Documento de Word de Office 2007+)

Convertir PDF para DOCM

(Archivo Marco de Microsoft Word 2007)

Convertir PDF para DOT

(Archivos de plantilla de Microsoft Word)

Convertir PDF para DOTX

(Archivo de plantilla de Microsoft Word)

Convertir PDF para DOTM

(Archivo de plantilla de Microsoft Word 2007+)

Convertir PDF para TXT

(Documento de texto)

Convertir PDF para RTF

(Formato de texto enriquecido)

Convertir PDF para HTML

(Lenguaje de marcado de hipertexto)

Convertir PDF para HTM

(Archivo de lenguaje de marcado de hipertexto)

Convertir PDF para MHTML

(Formato de archivo de página web)

Convertir PDF para MHT

(Archivo web MHTML)

Convertir PDF para XLS

(Hoja de cálculo de Microsoft Excel (heredado))

Convertir PDF para XLSX

(Libro de trabajo XML abierto)

Convertir PDF para XLSM

(Hoja de cálculo habilitada para macros)

Convertir PDF para XLSB

(Libro binario de Excel)

Convertir PDF para XLT

(Excel 97 - Plantilla 2003)

Convertir PDF para XLTX

(Plantilla de Excel)

Convertir PDF para XLTM

(Plantilla de Excel habilitada para macros)

Convertir PDF para XLAM

(Complemento de Excel habilitado para macros)

Convertir PDF para CSV

(Valores separados por comas)

Convertir PDF para TSV

(Valores separados por tabulaciones)

Convertir PDF para DIF

(Formato de intercambio de datos)

Convertir PDF para SXC

(Hoja de cálculo de cálculo de StarOffice)

Convertir PDF para FODS

(Hoja de cálculo XML plano de OpenDocument)

Convertir PDF para PPT

(Microsoft PowerPoint 97-2003)

Convertir PDF para PPTX

(Formato de presentación XML abierto)

Convertir PDF para PPTM

(Archivo de presentación habilitado para macros)

Convertir PDF para PPS

(Presentación de diapositivas de PowerPoint)

Convertir PDF para PPSX

(Presentación de diapositivas de PowerPoint)

Convertir PDF para PPSM

(Presentación de diapositivas habilitada para macros)

Convertir PDF para POT

(Archivos de plantilla de Microsoft PowerPoint)

Convertir PDF para POTX

(Presentación de plantilla de Microsoft PowerPoint)

Convertir PDF para POTM

(Archivo de plantilla de Microsoft PowerPoint)

Convertir PDF para ODT

(Formato de archivo de texto de OpenDocument)

Convertir PDF para OTT

(Formato estándar de OpenDocument)

Convertir PDF para OTP

(Formato estándar de OpenDocument)

Convertir PDF para ODP

(Formato de presentación de OpenDocument)

Convertir PDF para ODS

(Hoja de cálculo de OpenDocument)

Convertir PDF para EMZ

(Metarchivo mejorado comprimido de Windows)

Convertir PDF para WMZ

(Metarchivo de Windows comprimido)

Convertir PDF para SVG

(Gráficos vectoriales escalares)

Convertir PDF para SVGZ

(Gráficos vectoriales escalables comprimidos)

Convertir PDF para XPS

(Especificaciones de papel XML)

Convertir PDF para TEX

(Documento fuente de LaTeX)

Convertir PDF para WMF

(Metarchivo de Windows)

Convertir PDF para EMF

(Formato de metarchivo mejorado)

Convertir PDF para BMP

(Archivo de imagen de mapa de bits)

Convertir PDF para PNG

(Gráfico de red portátil)

Convertir PDF para GIF

(Formato de intercambio gráfico)

Convertir PDF para JPEG

(Imagen conjunta del grupo de expertos en fotografía)

Convertir PDF para TIFF

(Formato de archivo de imagen etiquetado)

Convertir PDF para ICO

(Archivo de icono)

Convertir PDF para WEBP

(Formato de imagen web ráster)

Convertir PDF para JP2

(Imagen principal JPEG 2000)

Convertir PDF para TGA

(Adaptador de gráficos Truevision)

Convertir PDF para PSB

(Formato de documento grande de Photoshop)

Convertir PDF para PSD

(Documento de Photoshop)

Convertir PDF para EPUB

(Abrir archivo de libro electrónico)

Convertir PDF para MD

(Lenguaje de rebajas)

Convertir PDF para DICOM

(Imágenes digitales y comunicaciones)

Convertir PDF para FODP

(Presentación de documento abierto)

Convertir PDF para JPG

(Imagen conjunta del grupo de expertos en fotografía)

Convertir PDF para ZIP

(Archivo comprimido)

Convertir PDF para JSON

(Archivo de notación de objetos de JavaScript)

Convertir PDF para DXF

(Formato de intercambio de dibujos de Autodesk)

 Español