1. 产品
  2.   Conholdate.Total
  3.   Java
  4.   通過 Java 或在線應用程序將 WORD 轉換為 XML

通過 Java 或在線應用程序將 WORD 轉換為 XML

在 Java 和 J2SE 應用程序中使用靈活的文檔操作選項以編程方式將 WORD 轉換為 XML,以自定義生成文檔的外觀。 word文檔轉換庫準確地將Word文檔格式轉換為PDF、Excel電子表格、PowerPoint演示文稿、Photoshop、HTML、電子書、XML、圖像等多種流行文件格式。使用多種文檔轉換功能——轉換整個文檔或根據自選頁碼或頁面範圍選擇源文檔文件的特定頁面,無需使用任何外部軟件即可輕鬆轉換為支持的文檔格式。

下载

如何在 Java 中將 WORD 轉換為 XML

使用三個簡單的步驟在 Java 中執行 WORD 到 XML 文件的轉換。無需使用任何外部軟件即可按原樣查看轉換後的 MHTML 文檔或將其呈現和顯示為 HTML。

下載 獲取相應的程序集文件或從 Maven 獲取整個包到直接在您的工作區中添加Conholdate.Total for Java

  • 創建 Converter 類的新實例並加載 WORD 文件
  • 為 XML 文檔類型設置 ConvertOptions
  • 調用Converter類實例的Convert方法轉換為XML
  • 設置 HTML 查看器的選項
  • 創建 Viewer 對像以將轉換後的 XML 視為 HTML

WORD 到 XML 转换的免费应用程序



將水印添加到 Word 並轉換為 PDF

準確 用 Java 將 Word 文檔轉換為 PDF,與原始源文件一模一樣,並且 應用文本或圖像水印到 PDF 文檔頁面。

  • 創建 Converter 類的新實例以轉換 Word DOCX 文檔
  • 實例化正確的 ConvertOptions 類(PdfConvertOptions、WordProcessingConvertOptions、SpreadsheetConvertOptions)
  • 創建 WatermarkOptions 類的新實例
  • 指定水印屬性(顏色、寬度、高度、文本、圖像等)
  • 設置 ConvertOptions 實例的 Watermark 屬性
  • 調用Converter類實例的Convert方法進行Word到PDF的轉換

加載和轉換遠程文檔

使用 Conholdate.Total for Java – 開發人員可以從各種遠程位置和雲文檔存儲資源(如 Amazon S3、Microsoft Azure Blob、FTP、本地磁盤、流或簡單 URL)加載和轉換文檔。只需指定獲取遠程文檔流的方法,然後將其作為構造函數傳遞給 Converter 類。

Conholdate.Total for Java API 支持不同的操作系統,例如 Windows J2SE、Linux(Ubuntu、OpenSUSE、CentOS 等)、macOS 和任何類型的基於 Eclipse、IntelliJ NetBeans、IntelliJ IDEA 或 Visual Studio Code 開發環境的 Java 應用程序.


受密碼保護的 Word 到 PDF 的轉換

在基於 Java 的應用程序中快速 加載受密碼保護的 Word 文檔並將其轉換為 PDF - 您只需要幾行代碼的代碼。開發人員還可以將 Word(DOC 或 DOCX)文檔轉換為其他格式,如 Web(HTML、MHTML)、圖像(JPG、PNG TIFF、BMP)、Markdown 和許多其他格式,而無需安裝 Microsoft Word。

  • 創建 Converter 類的新實例並傳遞源文檔路徑
  • 實例化正確的 ConvertOptions 類,例如(PdfConvertOptions、WordProcessingConvertOptions、SpreadsheetConvertOptions 等)
  • 調用 Converter 類實例的 convert 方法並為轉換後的文檔傳遞文件名

WORD 文檔信息提取

文檔信息提取功能不僅可以獲取有關源文檔文件的基本信息,還支持提取一些有價值的文件格式特定信息。它包括 Microsoft Project 文件的項目開始和結束日期、PDF 文檔的任何打印限制、Outlook 數據文件中包含的文件夾列表以及 CAD 文檔中有關圖層和佈局的信息。

Conholdate.Total Java API 用於文檔轉換的另一個有用特性是自動檢測以字節流形式傳遞的源文檔的未知文件格式擴展名。


在 Java 中將特定的 Word 頁面轉換為 PDF

Java 文檔轉換 API 允許您從源文檔中選擇選定的頁面,並準確地轉換為支持的文檔格式。下面的代碼示例顯示瞭如何將 Word 文檔的第 1 頁和第 4 頁轉換為生成的 PDF 文件。

  • 創建 Converter 類的新實例並加載輸入 (Word) 文檔
  • 實例化正確的 ConvertOptions 類,例如(PdfConvertOptions、WordProcessingConvertOptions、SpreadsheetConvertOptions 等)
  • 設置 ConvertOptions 實例的 setPages 屬性並提及要轉換的特定頁碼
  • 調用 Converter 類實例的 convert 方法並為轉換後的文檔傳遞文件名(PDF)

緩存 XML 文檔結果

在某些情況下,轉換後的文檔尺寸更大,轉換需要時間。文檔轉換庫提供緩存功能以有效管理此類情況並加快重複轉換過程。啟用 ICache 接口以使用擴展點與自定義緩存實現一起工作,並根據您的喜好控制緩存轉換。

轉換結果默認保存到本地驅動器,但任何類型的緩存存儲都可以通過實現適當的接口來支持,例如 Amazon S3、Dropbox、Google Drive、Windows Azure、Reddis 或任何其他接口。


經常問的問題

我如何開始使用 Conholdate.Total for Java API,使用演示或代碼示例將 WORD 轉換為 XML?

Conholdate.Total for Java 平台提供了各種選項和演示,以使用 GroupDocsAspose 代碼示例。 Java 程序員可以輕鬆地將 GroupDocs.Conversion 示例用於前端和後端實施,或者他們可以在基於 Java 的應用程序中使用 WORD 到 XML 的轉換功能創建自己的項目。

上面分享的代碼片段中哪些API用於WORD到XML的轉換?

Conholdate.Total for Java 包括 Aspose 和 GroupDocs 提供的所有 Java API。然而,開發人員可以使用不同的 API 將 WORD 轉換為 XML;為了簡單起見,我們使用 GroupDocs.Conversion for Java 演示了代碼片段。

Conholdate.Total for Java 支持哪些文檔和圖像文件格式?

Conholdate.Total for Java 集成了 Aspose 和 GroupDocs 的 API,使 Java 程序員能夠對各種文件格式執行各種文檔操作操作 包括基於 Java 和 J2SE 的應用程序中的 Word、Excel、PDF、PowerPoint、Visio、HTML 和圖像。

我可以使用此 API 將受密碼保護的 WORD 文件轉換為 XML 嗎?

絕對地! Conholdate.Total API 無縫處理受密碼保護的 WORD 文件的轉換。在轉換過程中,您只需在設定轉換器時使用特定載入選項提供密碼即可。即使對於加密的 WORD 文件,這也可確保安全且有效率的轉換。

我可以在 Java 中僅將某些頁面從 WORD 文件轉換為 XML 嗎?

是的,一點沒錯!透過使用轉換選項,您可以有效地將整個 WORD 文件或僅選定的頁面轉換為 XML 格式。

從 WORD 文件轉換時可以自訂輸出 XML 檔案嗎?

是的,當然可以! Conholdate.Total API 可讓您超越基本轉換,為您的 XML 檔案提供自訂選項。優化影像品質、添加安全浮水印並探索其他功能,以根據您的特定需求操縱輸出 XML 的外觀。

什么是XML文件格式?

XML 代表可扩展标记语言,它与 HTML 类似,但在使用标签来定义对象方面有所不同。创建 XML 文件格式背后的整个想法是在不依赖软件或硬件工具的情况下存储和传输数据。它的流行是因为它既是人类可读的又是机器可读的。这使其能够以对象的形式创建通用数据协议,以便通过网络(如万维网 (WWW))存储和共享。 “X”在 XML 中是可扩展的,这意味着该语言可以根据用户要求扩展到任意数量的符号。正是因为这些功能,许多标准文件格式都使用了它,例如 Microsoft Open XML、LibreOffice OpenDocument、XHTML 和 SVG。

学习

Java 的热门 WORD 转换选项

转变 WORD 到 PDF

(便携式文件格式)

转变 WORD 到 IMAGE

(图像文件)

转变 WORD 到 WEB

(网页文件)

转变 WORD 到 DOC

(Microsoft Word 二进制格式)

转变 WORD 到 DOCX

(Office 2007+ Word 文档)

转变 WORD 到 DOCM

(Microsoft Word 2007 马可文件)

转变 WORD 到 DOT

(Microsoft Word 模板文件)

转变 WORD 到 DOTX

(微软 Word 模板文件)

转变 WORD 到 DOTM

(Microsoft Word 2007+ 模板文件)

转变 WORD 到 TXT

(文本文件)

转变 WORD 到 RTF

(富文本格式)

转变 WORD 到 HTML

(超文本标记语言)

转变 WORD 到 MHTML

(网页存档格式)

转变 WORD 到 HTM

(超文本标记语言文件)

转变 WORD 到 MHT

(MHTML 网络档案)

转变 WORD 到 XLS

(Microsoft Excel 电子表格(旧版))

转变 WORD 到 XLSX

(打开 XML 工作簿)

转变 WORD 到 XLSM

(启用宏的电子表格)

转变 WORD 到 XLSB

(Excel 二进制工作簿)

转变 WORD 到 XLT

(Excel 97 - 2003 模板)

转变 WORD 到 XLTX

(Excel 模板)

转变 WORD 到 XLTM

(Excel 启用宏的模板)

转变 WORD 到 XLAM

(Excel 启用宏的加载项)

转变 WORD 到 CSV

(逗号分隔值)

转变 WORD 到 TSV

(制表符分隔值)

转变 WORD 到 FODS

(OpenDocument 平面 XML 电子表格)

转变 WORD 到 DIF

(数据交换格式)

转变 WORD 到 SXC

(StarSuite Calc 电子表格)

转变 WORD 到 PPT

(微软PowerPoint 97-2003)

转变 WORD 到 PPTX

(打开 XML 表示格式)

转变 WORD 到 PPS

(幻灯片放映)

转变 WORD 到 PPSX

(幻灯片放映)

转变 WORD 到 PPSM

(启用宏的幻灯片放映)

转变 WORD 到 POT

(Microsoft PowerPoint 模板文件)

转变 WORD 到 POTX

(Microsoft PowerPoint 模板演示文稿)

转变 WORD 到 PPTM

(启用宏的演示文件)

转变 WORD 到 POTM

(微软 PowerPoint 模板文件)

转变 WORD 到 ODT

(OpenDocument 文本文件格式)

转变 WORD 到 OTT

(OpenDocument 标准格式)

转变 WORD 到 ODS

(OpenDocument 电子表格)

转变 WORD 到 ODP

(OpenDocument 演示格式)

转变 WORD 到 OTP

(OpenDocument 标准格式)

转变 WORD 到 TIFF

(标记图像文件格式)

转变 WORD 到 JPEG

(联合摄影专家组图片)

转变 WORD 到 PNG

(便携式网络图形)

转变 WORD 到 GIF

(图形交换格式)

转变 WORD 到 BMP

(位图图像文件)

转变 WORD 到 ICO

(图标文件)

转变 WORD 到 WMF

(Windows 元文件)

转变 WORD 到 EMF

(增强的元文件格式)

转变 WORD 到 DCM

(DICOM 图像)

转变 WORD 到 WEBP

(光栅 Web 图像格式)

转变 WORD 到 JP2

(JPEG 2000 核心图像)

转变 WORD 到 EMZ

(Windows 压缩增强元文件)

转变 WORD 到 WMZ

(压缩的 Windows 元文件)

转变 WORD 到 SVG

(标量矢量图形)

转变 WORD 到 SVGZ

(压缩的可缩放矢量图形)

转变 WORD 到 TGA

(Truevision 图形适配器)

转变 WORD 到 XPS

(XML 纸张规格)

转变 WORD 到 TEX

(乳胶源文件)

转变 WORD 到 MD

(降价语言)

转变 WORD 到 PSD

(Photoshop 文档)

转变 WORD 到 PSB

(Photoshop 大型文档格式)

转变 WORD 到 JSON

(JavaScript 对象符号文件)

转变 WORD 到 MOBI

(打开电子书格式)

转变 WORD 到 PCL

(打印机命令语言文档)

转变 WORD 到 PS

(PostScript 文件)

转变 WORD 到 EPUB

(打开电子书文件)

 中国人