1. 製品
  2.   Conholdate.Total
  3.   Java
  4.   Java で PDF を HTML に変換

Java で PDF を HTML に変換

柔軟な PDF ドキュメント変換 API を使用して Java アプリケーションで PDF ファイルを HTML に変換し、変換された HTML ドキュメントの外観をニーズに合わせて操作します。 PDF 変換ライブラリは、ワード処理ドキュメント、Excel スプレッドシート、PowerPoint プレゼンテーション、Photoshop、電子ブック、Web、画像など、さまざまな形式への PDF 変換を提供します。 PDF 全体を簡単に変換したり、ページ番号や範囲に基づいて特定のページを選択したりできます。 PDF Converter API とオンライン PDF から HTML への変換ツールを今すぐ無料でお試しください。

ダウンロード

Java で PDF を HTML に変換する方法

3 つの簡単な手順を使用して、Java で PDF ファイルから HTML ファイルへの変換を実行します。以下のコード例を使用すると、外部ソフトウェアをインストールせずに、変換されたドキュメントをそのまま表示するか、さらにレンダリングして HTML ファイルとして表示します。

ダウンロード からそれぞれのアセンブリ ファイルを取得するか、Maven からパッケージ全体を取得します。 Conholdate.Total をワークスペースに直接追加します。

  • Converter クラスの新しいインスタンスを作成し、PDF ファイルをロードします
  • HTML ファイル タイプに ConvertOptions を設定します
  • Converter クラス インスタンスの Convert メソッドを呼び出して HTML に変換します
  • HTML ビューアのオプションを設定します
  • 変換された HTML を HTML として表示するには Viewer オブジェクトを作成します

PDF から HTML への変換用の無料アプリ



Java で PDF を Word ドキュメントに変換する

Conholdate.Total API を使用すると、Java で PDF を Word ドキュメントに変換 アプリケーションが簡単になります。 PDF ファイルは Word (DOCX) ファイルに完全に変換され、ニーズに合わせて出力ファイルのレイアウトをカスタマイズするための追加の文書書式設定機能セットをサポートしています。変換された Word 文書からテキスト、表、画像、リストなどのコンテンツを簡単に編集できます。

  • Converter クラスの新しいインスタンスを作成し、PDF を入力ファイルとしてロードします
  • WordProcessingConvertOptions を変換オプションとしてインスタンス化します
  • Converter クラス インスタンスの Convert メソッドを呼び出して DOCX に変換します

PDFドキュメント情報の抽出

ドキュメント情報抽出機能を使用すると、ソース ドキュメント ファイルに関する基本情報を取得できるだけでなく、Microsoft Project ファイルのプロジェクトの開始日と終了日、PDF ドキュメントの印刷制限などの貴重なファイル形式固有の情報の抽出もサポートされます。 Outlookデータファイルなどに含まれるフォルダーのリスト。

NetBeans、IntelliJ IDEA、Eclipse などの開発環境を使用しながら、Windows、Linux、macOS などのさまざまなオペレーティング システムで一般的なドキュメント ファイル形式を変換します。


Java で PDF を Excel に変換

数行の Java コードを使用して、PDF を Excel スプレッドシートに変換 します。 PDF ファイルの内容は Excel ワークシートの行と列に変換され、必要に応じて簡単に編集できます。 PDF ファイルは、スプレッドシート形式 (XLS、XLSX、XLSM、XLSB、XLTX、XLT)、OpenDocument (ODS、OTS)、および Apple iWork Numbers に変換できます。

  • Converter クラスの新しいインスタンスを作成し、PDF を入力ファイルとしてロードします
  • SpreadsheetConvertOptions を変換オプションとしてインスタンス化します
  • Converter クラス インスタンスの Convert メソッドを呼び出して XLSX に変換します

HTML ドキュメント結果のキャッシュ

場合によっては、変換された文書のサイズが大きくなり、変換に時間がかかることがあります。ドキュメント変換ライブラリは、このような状況を効率的に管理し、反復的な変換プロセスを高速化するためのキャッシュ機能を提供します。 ICache インターフェイスが拡張ポイントを使用してカスタム キャッシュ実装と連携し、必要に応じてキャッシュ変換を制御できるようにします。

変換結果はデフォルトでローカル ドライブに保存されますが、Amazon S3、Dropbox、Google Drive、Windows Azure、Reddis などの適切なインターフェイスを実装することで、あらゆる種類のキャッシュ ストレージをサポートできます。


Java で PDF を PowerPoint に変換

PDF から PowerPoint への変換 (PPT、PPTX) スライドは、Conholdate.Total for Java API を使用すると高速になります。変換後は、Microsoft PowerPoint で PowerPoint プレゼンテーションやスライドを簡単に編集できます。

  • Converter クラスの新しいインスタンスを作成し、PDF を入力ファイルとしてロードします
  • PresentationConvertOptions を変換オプションとしてインスタンス化します
  • Converter クラス インスタンスの Convert メソッドを呼び出して PPTX に変換します

リモートにある PDF をロードして変換する

Conholdate.Total for Java を使用する – 開発者は、さまざまなリモートの場所や、Amazon S3、Microsoft Azure Blob、FTP、ローカル ディスク、ストリーム、単純な URL などのクラウド ドキュメント ストレージ リソースから PDF やその他のドキュメントをロードして変換できます。リモートにあるドキュメント ストリームを取得するメソッドを指定し、それをコンストラクターとして Converter クラスに渡すだけです。

Java PDF 変換ライブラリ は、Java ベースのアプリケーション内でパスワードで保護されているドキュメントのロードと変換もサポートしています。


Java で PDF を画像に変換する

PDF を画像に変換 JPG、PNG、GIF、BMP、TIFF などの形式を正確な画質で変換そして解像度。 PDF ファイル全体を変換するか、選択したいくつかのページを選択して画像に変換します。

  • Converter クラスの新しいインスタンスを作成し、PDF を入力ファイルとしてロードします
  • 変換されたドキュメント ページをストリームに保存する SavePageStream デリゲートを宣言します
  • ImageConvertOptions オブジェクトを渡すことで、JPG を目的の出力形式として指定します
  • Converter クラス インスタンスの Convert メソッドを呼び出して JPG に変換します

PDF にテキストまたは画像の透かしを追加する

ドキュメントを元のファイルとまったく同じように正確に変換し、テキストまたは画像の透かしを PDF に追加 およびその他のサポートされているドキュメント形式に変換します。フォント、色、幅、高さ、回転角度、透明度を管理し、文書ページの背景に透かしを配置するためのいくつかの透かしオプションのセットを使用して、透かしをスマートにスタンプします。

ソース ドキュメント形式の自動検出は、ソース ファイルがバイト ストリームの形式で表示される場合に、ファイル拡張子自体を取得するためのもう 1 つの便利な機能です。開発者は、Converter オブジェクトの GetPossibleConversions メソッドを呼び出すことで、あるドキュメントを別のファイル形式に変換するときに、サポートされているすべての変換形式の完全なリストを取得することもできます。


PDFファイル形式とは?

PDF (Portable Document Format) は、1993 年に Adobe Systems によって開発されたドキュメント ファイル形式です。これは、異なるオペレーティング システムやインターネット上でドキュメントを保存および共有するためのプラットフォームに依存しない方法を提供するように設計されました。 PDF はベクトルベースの描画モデルを使用します。これは、グラフィック要素 (線、形状、画像など) を数式として保存することを意味します。これにより、PDF の解像度が独立したものになり、どのような種類のデバイスやプログラムで閲覧してもドキュメントの品質が一定に保たれます。PDF は暗号化、パスワード保護、デジタル署名などの多くのセキュリティ機能もサポートしています。 、および文書の透かし。 PDF は現在、ドキュメントを共有する最も一般的な方法の 1 つです。医療文書や法律文書、政府の書類、請求書など、さまざまな場面で使用されます。さらに、印刷業界では顧客と電子的に通信するために使用されます。 PDF は、Word ドキュメント、PowerPoint プレゼンテーション、Web ページなど、あらゆる種類の電子ドキュメントから作成できます。ただし、PDF は編集できないことに注意してください。 PDF に変更を加えるには、まず PDF を別のファイル形式に変換する必要があります。これを行うために利用できるソフトウェア プログラムが多数あり、そのほとんどは無料でダウンロードできます。

学び

HTMLファイル形式とは?

HTML (Hypertext Markup Language) は、Web ページの作成に使用される標準のマークアップ言語です。これはあらゆる Web サイトの基盤であり、インターネット上でデジタル ドキュメントを作成するために使用される最初の言語です。 HTML は、Web ページ上のテキスト、画像、オーディオ、ビデオに構造を与えるために使用されます。 HTML ドキュメントは、HTML と CSS の 2 種類のファイルで構成されます。 HTML ファイルにはドキュメントの構造のマークアップが含まれ、CSS ファイルには HTML 要素をフォーマットするためのスタイル情報が含まれます。 HTML マークアップはタグの形式で記述されます。これらのタグは、ページ上のコンテンツを表示する方法をブラウザーに指示します。簡単に認識できる HTML タグには、head、body、title、h1、および p が含まれます。 HTML ファイルは .html ファイル拡張子で終わります。デフォルトでは、ファイルをクリックすると HTML ドキュメントが Web ブラウザで開きます。 HTML ドキュメントは、Notepad++ や Sublime Text などのテキスト エディタで表示することもできます。 Web ページを作成するときは、HTML と CSS の両方を使用してページを構築する必要があります。 HTML は構造を提供し、CSS はスタイルを提供します。これらが連携して Web のバックボーンを形成し、Web ブラウザでデジタル ドキュメントを表示できるようになります。

学び

Java で人気のある PDF 変換オプション

変換 PDF に DOC

(Microsoft Wordバイナリ形式)

変換 PDF に DOCX

(Office 2007以降のWord文書)

変換 PDF に DOCM

(Microsoft Word 2007 マルコ ファイル)

変換 PDF に DOT

(Microsoft Wordテンプレートファイル)

変換 PDF に DOTX

(Microsoft Wordテンプレートファイル)

変換 PDF に DOTM

(Microsoft Word 2007+ テンプレート ファイル)

変換 PDF に TXT

(テキストドキュメント)

変換 PDF に RTF

(リッチテキスト形式)

変換 PDF に HTML

(ハイパーテキストマークアップ言語)

変換 PDF に HTM

(ハイパーテキスト マークアップ言語ファイル)

変換 PDF に MHTML

(Web ページのアーカイブ形式)

変換 PDF に MHT

(MHTML ウェブ アーカイブ)

変換 PDF に XLS

(Microsoft Excel スプレッドシート (レガシー))

変換 PDF に XLSX

(XML ワークブックを開く)

変換 PDF に XLSM

(マクロが有効なスプレッドシート)

変換 PDF に XLSB

(Excel バイナリ ワークブック)

変換 PDF に XLT

(Excel 97 - 2003 テンプレート)

変換 PDF に XLTX

(Excel テンプレート)

変換 PDF に XLTM

(Excel マクロ有効テンプレート)

変換 PDF に XLAM

(Excel マクロ有効アドイン)

変換 PDF に CSV

(カンマ区切りの値)

変換 PDF に TSV

(タブ区切りの値)

変換 PDF に DIF

(データ交換フォーマット)

変換 PDF に SXC

(StarOffice Calc スプレッドシート)

変換 PDF に FODS

(OpenDocument フラット XML スプレッドシート)

変換 PDF に PPT

(Microsoft PowerPoint 97-2003)

変換 PDF に PPTX

(オープン XML プレゼンテーション形式)

変換 PDF に PPTM

(マクロが有効なプレゼンテーション ファイル)

変換 PDF に PPS

(PowerPoint スライド ショー)

変換 PDF に PPSX

(PowerPoint スライド ショー)

変換 PDF に PPSM

(マクロを有効にしたスライド ショー)

変換 PDF に POT

(Microsoft PowerPoint テンプレート ファイル)

変換 PDF に POTX

(Microsoft PowerPoint テンプレートのプレゼンテーション)

変換 PDF に POTM

(Microsoft PowerPoint テンプレート ファイル)

変換 PDF に ODT

(OpenDocument テキスト ファイル形式)

変換 PDF に OTT

(OpenDocument標準フォーマット)

変換 PDF に OTP

(OpenDocument標準フォーマット)

変換 PDF に ODP

(OpenDocument プレゼンテーション形式)

変換 PDF に ODS

(OpenDocument スプレッドシート)

変換 PDF に EMZ

(Windows 圧縮拡張メタファイル)

変換 PDF に WMZ

(圧縮された Windows メタファイル)

変換 PDF に SVG

(スカラー ベクター グラフィックス)

変換 PDF に SVGZ

(圧縮されたスケーラブルなベクター グラフィックス)

変換 PDF に XPS

(XML 用紙の仕様)

変換 PDF に TEX

(LaTeX ソースドキュメント)

変換 PDF に DCM

(DICOM画像)

変換 PDF に WMF

(Windows メタファイル)

変換 PDF に EMF

(拡張メタファイル形式)

変換 PDF に BMP

(ビットマップ画像ファイル)

変換 PDF に PNG

(ポータブルネットワークグラフィックス)

変換 PDF に GIF

(グラフィカル交換フォーマット)

変換 PDF に JPEG

(共同写真専門家グループのイメージ)

変換 PDF に TIFF

(タグ付き画像ファイル形式)

変換 PDF に ICO

(アイコンファイル)

変換 PDF に WEBP

(ラスター Web イメージ形式)

変換 PDF に JP2

(JPEG 2000 コア画像)

変換 PDF に TGA

(Truevision グラフィックス アダプター)

変換 PDF に PSB

(Photoshop ラージ ドキュメント フォーマット)

変換 PDF に PSD

(Photoshop ドキュメント)

変換 PDF に EPUB

(電子書籍ファイルを開く)

変換 PDF に MD

(マークダウン言語)

変換 PDF に DICOM

(デジタル イメージングと通信)

変換 PDF に FODP

(オープンドキュメントプレゼンテーション)

変換 PDF に JPG

(共同写真専門家グループのイメージ)

変換 PDF に ZIP

(圧縮ファイル)

変換 PDF に JSON

(JavaScript オブジェクト表記ファイル)

変換 PDF に XML

(XMLファイル)

変換 PDF に DXF

(Autodesk 図面交換フォーマット)

 日本