1. 产品
  2.   Conholdate.Total
  3.   Java
  4.   在Java中將PDF轉換為HTML

在Java中將PDF轉換為HTML

使用我們靈活的 PDF 文件轉換 API 在 Java 應用程式中將 PDF 文件轉換為 HTML,以根據您的需求操作轉換後的 HTML 文件的外觀。 PDF 轉換庫提供將 PDF 轉換為多種格式的功能,包括 Word 處理文件、Excel 試算表、PowerPoint 簡報、Photoshop、電子書、網頁和圖像。輕鬆轉換整個 PDF 或根據頁碼或範圍選擇特定頁面。立即免費試用 PDF Converter API 和我們的線上 PDF 到 HTML 轉換工具。

下载

如何在 Java 中將 PDF 轉換為 HTML

使用三個簡單的步驟在 Java 中執行 PDF 文件到 HTML 文件的轉換。使用下面的代碼示例——按原樣查看轉換後的文檔,或進一步渲染它以將其作為 HTML 文件查看,而無需安裝任何外部軟件。

下載 獲取相應的程序集文件或從 Maven 獲取整個包以直接在您的工作區中添加Conholdate.Total

  • 創建 Converter 類的新實例並加載 PDF 文件
  • 為 HTML 文件類型設置 ConvertOptions
  • 調用Converter類實例的Convert方法轉換為HTML
  • 設置 HTML 查看器的選項
  • 創建 Viewer 對像以將轉換後的 HTML 視為 HTML

PDF 到 HTML 转换的免费应用程序



在 Java 中將 PDF 轉換為 Word 文檔

使用 Conholdate.Total API 將 PDF 轉換為 Java 中的 Word 文檔 應用程序變得更加容易。 PDF 文件可完美轉換為 Word (DOCX) 文件,並支持一組額外的文檔格式設置功能,以自定義輸出文件的佈局以滿足您的需要。您可以輕鬆編輯轉換後的 Word 文檔中的文本、表格、圖像和列表等內容。

  • 創建 Converter 類的新實例並加載 PDF 作為輸入文件
  • 實例化 WordProcessingConvertOptions 作為轉換選項
  • 調用 Converter 類實例的 Convert 方法以轉換為 DOCX

PDF 文檔信息提取

文檔信息提取功能不僅允許獲取有關源文檔文件的基本信息,而且還支持提取一些有價值的文件格式特定信息,例如 Microsoft Project 文件的項目開始和結束日期、PDF 文檔的任何打印限制、包含在 Outlook 數據文件等中的文件夾列表。

在使用 NetBeans、IntelliJ IDEA 和 Eclipse 等開發環境的同時,在 Windows、Linux 或 macOS 等不同操作系統上轉換流行的文檔文件格式。


在 Java 中將 PDF 轉換為 Excel

將 PDF 轉換為 Excel 電子表格 使用幾行 Java 代碼。 PDF 文件的內容被轉換為 Excel 工作表的行和列,您可以根據需要輕鬆地對其進行編輯。 PDF 文件可以轉換為這些電子表格格式(XLS、XLSX、XLSM、XLSB、XLTX、XLT)、OpenDocument(ODS、OTS)和 Apple iWork Numbers。

  • 創建 Converter 類的新實例並加載 PDF 作為輸入文件
  • 實例化 SpreadsheetConvertOptions 作為轉換選項
  • 調用 Converter 類實例的 Convert 方法以轉換為 XLSX

緩存 HTML 文檔結果

在某些情況下,轉換後的文檔尺寸較大,轉換需要時間。文檔轉換庫提供緩存功能以有效管理此類情況並加快重複轉換過程。使用擴展點啟用 ICache 接口以使用自定義緩存實現,並根據需要控制緩存轉換。

轉換結果默認保存到本地驅動器,但通過實施適當的接口(如 Amazon S3、Dropbox、Google Drive、Windows Azure、Reddis 或任何其他接口)可以支持任何類型的緩存存儲。


在 Java 中將 PDF 轉換為 PowerPoint

將 PDF 轉換為 PowerPoint(PPT、PPTX)幻燈片使用 Conholdate.Total for Java API 速度更快。轉換後,您可以在 Microsoft PowerPoint 中輕鬆編輯 PowerPoint 演示文稿和幻燈片。

  • 創建 Converter 類的新實例並加載 PDF 作為輸入文件
  • 實例化 PresentationConvertOptions 作為轉換選項
  • 調用Converter類實例的Convert方法轉換為PPTX

載入並轉換遠端 PDF

使用 Conholdate.Total for Java – 開發人員可以從各種遠端位置和雲端文件儲存資源(例如 Amazon S3、Microsoft Azure Blob、FTP、本機磁碟、串流或簡單 URL)載入和轉換 PDF 和其他文件。您只需指定取得遠端文件流的方法,然後將其作為建構函式傳遞給 Converter 類別。

Java PDF 轉換庫 還支持在基於 Java 的應用程序中加載和轉換受密碼保護的文檔。


在 Java 中將 PDF 轉換為圖像

將 PDF 轉換為圖像 JPG、PNG、GIF、BMP、TIFF 等格式,具有精確的圖像質量和決議。轉換整個 PDF 文件或從某些選定頁面中選擇以轉換為圖像。

  • 創建 Converter 類的新實例並加載 PDF 作為輸入文件
  • 聲明 SavePageStream 委託以將轉換後的文檔頁面保存到流中
  • 通過將 ImageConvertOptions 對像傳遞給它,將 JPG 指定為所需的輸出格式
  • 調用 Converter 類實例的 Convert 方法以轉換為 JPG

在 PDF 中添加文字或圖像浮水印

準確轉換與原始文件完全相同的文檔和向 PDF 添加文本或圖像水印 和其他支持的文檔格式。使用一組水印選項巧妙地標記水印,以管理字體、顏色、寬度、高度、旋轉角度、透明度並將水印放置在文檔頁面的背景中。

在源文件以字節流形式呈現的某些情況下,自動檢測源文檔格式是檢索文件擴展名本身的另一個有用功能。在將一個文檔轉換為另一種文件格式時,開發人員還可以通過調用 Converter 對象的 GetPossibleConversions 方法獲得所有支持的轉換格式的完整列表。


什么是PDF文件格式?

可移植文档格式 (PDF) 是 Adobe 在 1990 年代创建的一种文档。这种文件格式的目的是引入一种标准,用于以独立于应用软件、硬件和操作系统的格式来表示文档和其他参考资料。 PDF 文件可以通过扩展/插件在 Adobe Acrobat Reader/Writer 以及大多数现代浏览器(如 Chrome、Safari、Firefox)中打开。大多数商用软件套件还提供将其文档转换为 PDF 文件格式的功能,而无需任何额外的软件组件。

学习

什么是HTML文件格式?

HTML被称为网络语言,随着新信息要求的要求而发展,要求将其显示为网页的一部分。最新的变体被称为 HTML 5,它为使用该语言提供了很大的灵活性。 HTML 页面要么从托管这些页面的服务器接收,要么也可以从本地系统加载。每个 HTML 页面都由 HTML 元素组成,例如表单、文本、图像、动画、链接等。这些元素由标签和其他几个元素表示,每个标签都有开始和结束。它还可以嵌入以 JavaScript 和样式表 (CSS) 等脚本语言编写的应用程序,以实现整体布局表示。

学习

Java 的热门 PDF 转换选项

转变 PDF 到 DOC

(Microsoft Word 二进制格式)

转变 PDF 到 DOCX

(Office 2007+ Word 文档)

转变 PDF 到 DOCM

(Microsoft Word 2007 马可文件)

转变 PDF 到 DOT

(Microsoft Word 模板文件)

转变 PDF 到 DOTX

(微软 Word 模板文件)

转变 PDF 到 DOTM

(Microsoft Word 2007+ 模板文件)

转变 PDF 到 TXT

(文本文件)

转变 PDF 到 RTF

(富文本格式)

转变 PDF 到 HTML

(超文本标记语言)

转变 PDF 到 HTM

(超文本标记语言文件)

转变 PDF 到 MHTML

(网页存档格式)

转变 PDF 到 MHT

(MHTML 网络档案)

转变 PDF 到 XLS

(Microsoft Excel 电子表格(旧版))

转变 PDF 到 XLSX

(打开 XML 工作簿)

转变 PDF 到 XLSM

(启用宏的电子表格)

转变 PDF 到 XLSB

(Excel 二进制工作簿)

转变 PDF 到 XLT

(Excel 97 - 2003 模板)

转变 PDF 到 XLTX

(Excel 模板)

转变 PDF 到 XLTM

(Excel 启用宏的模板)

转变 PDF 到 XLAM

(Excel 启用宏的加载项)

转变 PDF 到 CSV

(逗号分隔值)

转变 PDF 到 TSV

(制表符分隔值)

转变 PDF 到 DIF

(数据交换格式)

转变 PDF 到 SXC

(StarSuite Calc 电子表格)

转变 PDF 到 FODS

(OpenDocument 平面 XML 电子表格)

转变 PDF 到 PPT

(微软PowerPoint 97-2003)

转变 PDF 到 PPTX

(打开 XML 表示格式)

转变 PDF 到 PPTM

(启用宏的演示文件)

转变 PDF 到 PPS

(幻灯片放映)

转变 PDF 到 PPSX

(幻灯片放映)

转变 PDF 到 PPSM

(启用宏的幻灯片放映)

转变 PDF 到 POT

(Microsoft PowerPoint 模板文件)

转变 PDF 到 POTX

(Microsoft PowerPoint 模板演示文稿)

转变 PDF 到 POTM

(微软 PowerPoint 模板文件)

转变 PDF 到 ODT

(OpenDocument 文本文件格式)

转变 PDF 到 OTT

(OpenDocument 标准格式)

转变 PDF 到 OTP

(OpenDocument 标准格式)

转变 PDF 到 ODP

(OpenDocument 演示格式)

转变 PDF 到 ODS

(OpenDocument 电子表格)

转变 PDF 到 EMZ

(Windows 压缩增强元文件)

转变 PDF 到 WMZ

(压缩的 Windows 元文件)

转变 PDF 到 SVG

(标量矢量图形)

转变 PDF 到 SVGZ

(压缩的可缩放矢量图形)

转变 PDF 到 XPS

(XML 纸张规格)

转变 PDF 到 TEX

(乳胶源文件)

转变 PDF 到 DCM

(DICOM 图像)

转变 PDF 到 WMF

(Windows 元文件)

转变 PDF 到 EMF

(增强的元文件格式)

转变 PDF 到 BMP

(位图图像文件)

转变 PDF 到 PNG

(便携式网络图形)

转变 PDF 到 GIF

(图形交换格式)

转变 PDF 到 JPEG

(联合摄影专家组图片)

转变 PDF 到 TIFF

(标记图像文件格式)

转变 PDF 到 ICO

(图标文件)

转变 PDF 到 WEBP

(光栅 Web 图像格式)

转变 PDF 到 JP2

(JPEG 2000 核心图像)

转变 PDF 到 TGA

(Truevision 图形适配器)

转变 PDF 到 PSB

(Photoshop 大型文档格式)

转变 PDF 到 PSD

(Photoshop 文档)

转变 PDF 到 EPUB

(打开电子书文件)

转变 PDF 到 MD

(降价语言)

转变 PDF 到 DICOM

(医学中的数字成像和通信)

转变 PDF 到 ZIP

(压缩文件)

转变 PDF 到 JSON

(JavaScript 对象符号文件)

转变 PDF 到 XML

(XML 文件)

转变 PDF 到 DXF

(Autodesk 工程图交换格式)

 中国人