1. Produkty
  2.   Conholdate.Total
  3.   Java
  4.   Konwertuj plik PDF na XML w Java

Konwertuj plik PDF na XML w Java

Konwertuj pliki PDF do formatu XML w aplikacjach Java za pomocą naszego elastycznego interfejsu API do konwersji dokumentów PDF, aby manipulować wyglądem przekonwertowanego dokumentu tak, aby odpowiadał Twoim potrzebom. Biblioteka konwersji plików PDF umożliwia konwersję plików PDF do różnych formatów, w tym dokumentów edytora tekstu, arkuszy kalkulacyjnych programu Excel, prezentacji programu PowerPoint, programu Photoshop, e-booków, stron internetowych i obrazów. Z łatwością przekonwertuj cały plik PDF lub wybierz określone strony na podstawie numerów stron lub zakresów. Już dziś wypróbuj bezpłatnie interfejs PDF Converter API i nasze narzędzie online do konwersji plików PDF.

Ściągnij

Jak przekonwertować plik PDF na XML w Javie

Wykonaj konwersję plików PDF do pliku XML w Javie w trzech prostych krokach. Korzystając z poniższego przykładowego kodu – wyświetl przekonwertowany dokument w obecnej postaci lub wyrenderuj go dalej, aby wyświetlić jako plik HTML bez instalowania żadnego zewnętrznego oprogramowania.

Pobierz odpowiednie pliki zestawu z plików do pobrania lub pobierz cały pakiet z Maven do dodaj Conholdate.Total bezpośrednio do swojego obszaru roboczego.

  • Utwórz nową instancję klasy Converter i załaduj plik PDF
  • Ustaw ConvertOptions dla typu pliku XML
  • Wywołaj metodę Convert instancji klasy Converter w celu konwersji do XML
  • Ustaw opcje przeglądarki HTML
  • Utwórz obiekt Viewer, aby wyświetlić przekonwertowany XML jako HTML

Darmowa aplikacja do konwersji PDF na XML



Konwertuj pliki PDF na dokumenty Word w Javie

Coraz łatwiej jest konwertować dokumenty PDF na dokumenty Word w Javie za pomocą interfejsów API Conholdate.Total. Plik PDF doskonale przekształca się w plik Word (DOCX) i obsługuje dodatkowy zestaw funkcji formatowania dokumentu, aby dostosować układ pliku wyjściowego do własnych potrzeb. Możesz łatwo edytować zawartość, taką jak tekst, tabele, obrazy i listy z przekonwertowanego dokumentu Word.

  • Utwórz nową instancję klasy Converter i załaduj PDF jako plik wejściowy
  • Utwórz instancję WordProcessingConvertOptions jako opcję konwersji
  • Wywołaj metodę Convert instancji klasy Converter w celu konwersji do DOCX

Ekstrakcja informacji o dokumencie PDF

Funkcja wyodrębniania informacji o dokumentach nie tylko pozwala uzyskać podstawowe informacje o pliku dokumentu źródłowego, ale także obsługuje wyodrębnianie niektórych cennych informacji specyficznych dla formatu pliku, takich jak daty rozpoczęcia i zakończenia projektu w pliku Microsoft Project, wszelkie ograniczenia dotyczące drukowania w dokumencie PDF, lista folderów zawarta w pliku danych programu Outlook itp.

Konwertuj popularne formaty plików dokumentów w różnych systemach operacyjnych, takich jak Windows, Linux lub macOS, korzystając ze środowisk programistycznych, takich jak NetBeans, IntelliJ IDEA i Eclipse.


Konwertuj pliki PDF na Excel w Javie

Konwertuj pliki PDF na arkusze kalkulacyjne Excel, używając kilku linijek kodu Java. Zawartość pliku PDF jest konwertowana na wiersze i kolumny arkusza programu Excel, który można łatwo edytować według potrzeb. Plik PDF można konwertować na następujące formaty arkuszy kalkulacyjnych (XLS, XLSX, XLSM, XLSB, XLTX, XLT), OpenDocument (ODS, OTS) i Apple iWork Numbers.

  • Utwórz nową instancję klasy Converter i załaduj PDF jako plik wejściowy
  • Utwórz instancję SpreadsheetConvertOptions jako opcji konwersji
  • Wywołaj metodę Convert instancji klasy Converter w celu konwersji do XLSX

Buforowanie wyników dokumentu XML

W niektórych przypadkach rozmiar przekonwertowanego dokumentu jest większy i konwersja zajmuje trochę czasu. Biblioteka konwersji dokumentów oferuje funkcję buforowania, która pozwala efektywnie zarządzać takimi sytuacjami i przyspieszać powtarzalny proces konwersji. Włącz interfejs ICache do pracy z niestandardową implementacją pamięci podręcznej przy użyciu punktu rozszerzenia i kontroluj konwersję pamięci podręcznej, jak wolisz.

Wynik konwersji domyślnie zapisywany jest na dysku lokalnym, ale każdy rodzaj pamięci podręcznej może być obsługiwany poprzez wdrożenie odpowiednich interfejsów, takich jak Amazon S3, Dropbox, Google Drive, Windows Azure, Reddis lub dowolny inny.


Konwertuj pliki PDF na PowerPoint w Javie

Konwertowanie slajdów PDF na PowerPoint (PPT, PPTX) slajdów jest szybsze dzięki Conholdate.Total dla interfejsów API Java. Po konwersji możesz łatwo edytować prezentacje i slajdy programu PowerPoint w programie Microsoft PowerPoint.

  • Utwórz nową instancję klasy Converter i załaduj PDF jako plik wejściowy
  • Utwórz instancję PresentationConvertOptions jako opcji konwersji
  • Wywołaj metodę Convert instancji klasy Converter w celu konwersji do PPTX

Załaduj i skonwertuj zdalnie zlokalizowany plik PDF

Korzystanie z Conholdate.Total dla Java – programiści mogą ładować i konwertować pliki PDF i inne dokumenty z różnych zdalnych lokalizacji i zasobów przechowywania dokumentów w chmurze, takich jak Amazon S3, Microsoft Azure Blob, FTP, dysk lokalny, strumień lub prosty adres URL. Wystarczy określić metodę uzyskania zdalnie zlokalizowanego strumienia dokumentów, a następnie przekazać go klasie Converter jako konstruktor.

Biblioteka konwersji Java PDF obsługuje także ładowanie i konwertowanie dokumentów chronionych hasłem w aplikacjach opartych na Javie.


Konwertuj pliki PDF na obrazy w Javie

Konwertuj plik PDF na obraz formaty takie jak JPG, PNG, GIF, BMP, TIFF i wiele innych z precyzyjną jakością obrazu i rozdzielczość. Przekształć cały plik PDF lub wybierz jedną z wybranych stron, aby przekonwertować go na obrazy.

  • Utwórz nową instancję klasy Converter i załaduj PDF jako plik wejściowy
  • Zadeklaruj delegata SavePageStream, aby zapisać przekonwertowaną stronę dokumentu w strumieniu
  • Określ JPG jako żądany format wyjściowy, przekazując do niego obiekt ImageConvertOptions
  • Wywołaj metodę Convert instancji klasy Converter w celu konwersji do JPG

Dodaj tekstowe lub graficzne znaki wodne do pliku PDF

Dokładnie konwertuj dokumenty dokładnie tak, jak oryginalny plik i dodaj tekstowy lub graficzny znak wodny do pliku PDF i innych obsługiwanych formatów dokumentów. Inteligentnie stempluj znaki wodne, korzystając z zestawu opcji znaku wodnego, które umożliwiają zarządzanie czcionką, kolorem, szerokością, wysokością, kątem obrotu, przezroczystością i umieszczaniem znaku wodnego w tle stron dokumentu.

Automatyczne wykrywanie formatu dokumentu źródłowego to kolejna przydatna funkcja umożliwiająca odzyskanie samego rozszerzenia pliku w niektórych przypadkach, gdy plik źródłowy jest prezentowany w postaci strumienia bajtów. Programiści mogą także uzyskać pełną listę wszystkich obsługiwanych formatów konwersji podczas konwersji jednego dokumentu na inny format pliku, wywołując metodę GetPossibleConversions obiektu Converter.


Co to jest format pliku PDF?

Portable Document Format (PDF) to rodzaj dokumentu stworzony przez firmę Adobe w latach 90. XX wieku. Celem tego formatu pliku było wprowadzenie standardu reprezentacji dokumentów i innych materiałów referencyjnych w formacie niezależnym od oprogramowania aplikacji, sprzętu oraz systemu operacyjnego. Pliki PDF można otwierać w programie Adobe Acrobat Reader/Writer, a także w większości nowoczesnych przeglądarek, takich jak Chrome, Safari, Firefox za pośrednictwem rozszerzeń/wtyczek. Większość dostępnych na rynku pakietów oprogramowania oferuje również konwersję dokumentów do formatu PDF bez konieczności stosowania dodatkowego składnika oprogramowania.

Uczyć się

Co to jest format pliku XML?

XML oznacza Extensible Markup Language, który jest podobny do HTML, ale różni się w użyciu znaczników do definiowania obiektów. Cała idea stworzenia formatu pliku XML polegała na przechowywaniu i transporcie danych bez uzależnienia od narzędzi programowych lub sprzętowych. Jego popularność wynika z tego, że jest czytelny zarówno dla ludzi, jak i maszyn. Umożliwia to tworzenie wspólnych protokołów danych w postaci obiektów, które mają być przechowywane i udostępniane w sieci, takiej jak World Wide Web (WWW). „X” w XML jest rozszerzalny, co oznacza, że język można rozszerzyć na dowolną liczbę symboli zgodnie z wymaganiami użytkownika. Z tych funkcji korzysta wiele standardowych formatów plików, takich jak Microsoft Open XML, LibreOffice OpenDocument, XHTML i SVG.

Uczyć się

Popularne PDF opcje konwersji z Java

Konwertować PDF do DOC

(Format binarny Microsoft Word)

Konwertować PDF do DOCX

(Dokument programu Word 2007+)

Konwertować PDF do DOCM

(Plik Marco w programie Microsoft Word 2007)

Konwertować PDF do DOT

(Pliki szablonów Microsoft Word)

Konwertować PDF do DOTX

(Plik szablonu Microsoft Word)

Konwertować PDF do DOTM

(Plik szablonu programu Microsoft Word 2007+)

Konwertować PDF do TXT

(Dokument tekstowy)

Konwertować PDF do RTF

(Bogaty format tekstu)

Konwertować PDF do HTML

(hipertekstowy język znaczników)

Konwertować PDF do HTM

(Plik języka znaczników hipertekstowych)

Konwertować PDF do MHTML

(Format archiwum stron internetowych)

Konwertować PDF do MHT

(Archiwum internetowe MHTML)

Konwertować PDF do XLS

(Arkusz kalkulacyjny Microsoft Excel (starsza wersja))

Konwertować PDF do XLSX

(Otwórz skoroszyt XML)

Konwertować PDF do XLSM

(Arkusz kalkulacyjny z obsługą makr)

Konwertować PDF do XLSB

(Skoroszyt binarny programu Excel)

Konwertować PDF do XLT

(Szablon programu Excel 97 - 2003)

Konwertować PDF do XLTX

(Szablon Excela)

Konwertować PDF do XLTM

(Szablon programu Excel z obsługą makr)

Konwertować PDF do XLAM

(Dodatek Excel z obsługą makr)

Konwertować PDF do CSV

(Wartości oddzielone przecinkami)

Konwertować PDF do TSV

(Wartości oddzielone tabulatorami)

Konwertować PDF do DIF

(Format wymiany danych)

Konwertować PDF do SXC

(Arkusz kalkulacyjny StarOffice Calc)

Konwertować PDF do FODS

(Płaski arkusz kalkulacyjny OpenDocument XML)

Konwertować PDF do PPT

(Microsoft PowerPoint 97-2003)

Konwertować PDF do PPTX

(Otwórz format prezentacji XML)

Konwertować PDF do PPTM

(Plik prezentacji z obsługą makr)

Konwertować PDF do PPS

(Pokaz slajdów programu PowerPoint)

Konwertować PDF do PPSX

(Pokaz slajdów programu PowerPoint)

Konwertować PDF do PPSM

(Pokaz slajdów z obsługą makr)

Konwertować PDF do POT

(Pliki szablonów programu Microsoft PowerPoint)

Konwertować PDF do POTX

(Prezentacja szablonu Microsoft PowerPoint)

Konwertować PDF do POTM

(Plik szablonu programu Microsoft PowerPoint)

Konwertować PDF do ODT

(Format pliku tekstowego OpenDocument)

Konwertować PDF do OTT

(Standardowy format OpenDocument)

Konwertować PDF do OTP

(Standardowy format OpenDocument)

Konwertować PDF do ODP

(Format prezentacji OpenDocument)

Konwertować PDF do ODS

(Arkusz kalkulacyjny OpenDocument)

Konwertować PDF do EMZ

(Rozszerzony metaplik skompresowany w systemie Windows)

Konwertować PDF do WMZ

(Skompresowany metaplik Windows)

Konwertować PDF do SVG

(Skalarna grafika wektorowa)

Konwertować PDF do SVGZ

(Skompresowana skalowalna grafika wektorowa)

Konwertować PDF do XPS

(Specyfikacje papieru XML)

Konwertować PDF do TEX

(Dokument źródłowy LaTeX)

Konwertować PDF do WMF

(Metaplik Windows)

Konwertować PDF do EMF

(Ulepszony format metapliku)

Konwertować PDF do BMP

(Plik obrazu bitmapowego)

Konwertować PDF do PNG

(Przenośna grafika sieciowa)

Konwertować PDF do GIF

(Graficzny format wymiany)

Konwertować PDF do JPEG

(Obraz Wspólnej Grupy Ekspertów Fotograficznych)

Konwertować PDF do TIFF

(Oznaczony format pliku obrazu)

Konwertować PDF do WEBP

(Raster Web Format obrazu)

Konwertować PDF do JP2

(Obraz podstawowy JPEG 2000)

Konwertować PDF do TGA

(Karta graficzna Truevision)

Konwertować PDF do PSB

(Photoshop, duży format dokumentów)

Konwertować PDF do PSD

(Dokument Photoshop)

Konwertować PDF do EPUB

(Otwórz plik e-booka)

Konwertować PDF do MD

(Język przecen)

Konwertować PDF do DICOM

(Obrazowanie cyfrowe i komunikacja w medycynie)

Konwertować PDF do ZIP

(Spakowany plik)

Konwertować PDF do JSON

(Plik notacji obiektów JavaScript)

Konwertować PDF do DXF

(Format wymiany rysunków Autodesk)

 Polski