1. 产品
  2.   Conholdate.Total
  3.   Java
  4.   Java HTML 到 MHTML 轉換庫

Java HTML 到 MHTML 轉換庫

使用專為 Java 程式設計師和開發人員設計的一組進階 HTML 文件轉換功能。以程式設計方式將 HTML 轉換為 MHTML 以及 100 多種其他文件和影像格式,而無需依賴外部 HTML 文件處理 API。享受在文件中操作 HTML 元素的靈活性,自訂其外觀以滿足您的需求。在各種Web 文件格式(例如HTML、HTM、MHTML 和CHM)以及流行格式(例如PDF、Word 文件、Excel 工作表、PowerPoint 簡報、Photoshop 文件、電子書和各種圖像格式)之間無縫轉換。轉換整個 HTML 文件或根據頁碼或範圍選擇性地選擇特定頁面以獲得所需的輸出。使用線上工具體驗無縫 HTML 到 MHTML 文件轉換,輕鬆快速轉換和儲存 HTML 檔案。

下载

如何在 Java 中將 HTML 轉換為 MHTML

使用三個簡單的步驟在 Java 中執行 HTML 到 MHTML 文件的轉換。無需任何外部軟件即可按原樣查看轉換後的文檔或將其呈現為 HTML、PDF 或圖像文件。

下載 獲取相應的程序集文件或從 Maven 獲取整個包,以將 Conholdate.Total for Java 直接添加到您的工作區中。

  • 創建 Converter 類的新實例並加載 HTML 文件
  • 為 MHTML 文件類型設置 ConvertOptions
  • 調用Converter類實例的Convert方法轉換為MHTML
  • 設置圖像查看器的選項(JPG 或 PNG)
  • 創建 Viewer 對象,以 JPG 格式查看轉換後的 MHTML

HTML 到 MHTML 转换的免费应用程序



// Supported file formats: https://docs.groupdocs.com/conversion/java/supported-document-formats/
Converter converter = new Converter("input.html");
ConvertOptions convertOptions = new FileType().fromExtension("pdf").getConvertOptions();
converter.convert("output.pdf", convertOptions);
try (Viewer viewer = new Viewer("output.pdf"))
{
JpgViewOptions viewOptions = JpgViewOptions.forEmbeddedResources("output{0}.jpg");
viewer.view(viewOptions);
}

在 Java 應用程序中將 PDF 轉換為 HTML 文件

使用 Java 文檔和圖像轉換 API - 使用高級選項準確地 將 PDF 轉換為 HTML 文件來修改轉換後的 HTML 文檔。開發人員可以將頁面佈局修復為與源文檔中 HTML 元素的位置相同。您還可以調整縮放級別、計算頁數和設置密碼來解鎖受保護的文檔。

  • 創建 Converter 類的新實例並將 PDF 作為源文檔路徑傳遞
  • 實例化正確的 ConvertOptions 類,例如(PdfConvertOptions、WordProcessingConvertOptions、SpreadsheetConvertOptions、MarkupConvertOptions 等)
  • 調用Converter類實例的convert方法,並將HTML作為轉換後的文檔格式傳遞

提取 HTML 文件信息

文檔信息提取功能不僅可以獲取有關源文檔文件的基本信息,還支持提取一些有價值的文件格式特定信息,例如 Microsoft Project 文件的項目開始和結束日期、PDF 文檔的任何打印限制、包含在 Outlook 數據文件等中的文件夾列表。

在使用 NetBeans、IntelliJ IDEA 和 Eclipse 等開發環境的同時,在 Windows、Linux 或 macOS 等不同操作系統上轉換流行的文檔文件格式。


// Supported file formats: https://docs.groupdocs.com/conversion/java/supported-document-formats/
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("13579");
Converter converter = new Converter("input.pdf", loadOptions);
MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);
converter.convert("converted.html", options);

將水印添加到 HTML 並轉換為 PDF

Java 文檔和圖像轉換器 API 允許您將 Web 文檔(HTML、XML、JSON 等)完全轉換為原始文件,並 向 PDF 添加文本水印 和其他支持的文檔格式。在為轉換後的文檔添加水印並將其另存為 PDF 文件時,使用字體、顏色、寬度、高度、背景和旋轉角度等水印選項。

  • 創建 Converter 類的新實例並加載 HTML 文檔
  • 實例化正確的 ConvertOptions 類,例如(PdfConvertOptions、WordProcessingConvertOptions、SpreadsheetConvertOptions、MarkupConvertOptions 等)
  • 創建 WatermarkOptions 類的新實例
  • 設置 ConvertOptions 實例的 Watermark 屬性
  • 指定水印屬性(顏色、寬度、文本、高度等)
  • 調用Converter類實例的Convert方法轉換為PDF

加載和緩存 MHTML 文檔

在某些情況下,轉換後的文檔尺寸較大,轉換需要時間。文檔轉換庫提供緩存功能以有效管理此類情況並加快重複轉換過程。啟用 ICache 接口以使用擴展點與自定義緩存實現一起工作,並根據您的喜好控制緩存轉換。

轉換結果默認保存到本地驅動器,但任何類型的緩存存儲都可以通過實現適當的接口來支持,例如 Amazon S3、Dropbox、Google Drive、Windows Azure、Reddis 或任何其他接口。

文件格式轉換 API 還支持渲染來自不同來源的遠程文檔,包括 S3、Blob、FTP、Stream、URL 或本地磁盤。


// Supports converting documents between Word, Excel, PowerPoint, Images, Web, Photoshop, eBook, Metafiles and Diagram file formats.
// Supported file formats: https://docs.groupdocs.com/conversion/java/supported-document-formats/
Converter converter = new Converter("input.html");
PdfConvertOptions options = new PdfConvertOptions();
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(100);
watermark.setHeight(100);
watermark.setBackground(true);
options.setWatermark(watermark);
converter.convert("output.pdf", options);

經常問的問題

如何開始使用 Conholdate.Total for Java API,使用演示或代碼示例將 HTML 轉換為 MHTML?

Conholdate.Total for Java 平台提供了多種選項,用於使用 GroupDocsAspose 代碼示例。 Java 程序員可以輕鬆地將 GroupDocs.Conversion 示例用於前端和後端實施,或者他們可以在基於 Java 的應用程序中使用 HTML 到 MHTML 的轉換功能創建自己的項目。

上面分享的代碼片段中哪些API用於HTML到MHTML的轉換?

Conholdate.Total for Java 包括 Aspose 和 GroupDocs 提供的所有 Java API。然而,開發人員可以使用不同的 API 將 HTML 轉換為 MHTML;為了簡單起見,我們使用 GroupDocs.Conversion for Java 演示了代碼片段。

Conholdate.Total for Java 支持哪些文檔和圖像文件格式?

Conholdate.Total for Java 集成了 Aspose 和 GroupDocs 的 API,使 Java 程序員能夠對各種文件格式執行各種文檔操作操作 包括基於 Java 和 J2SE 的應用程序中的 Word、Excel、PDF、PowerPoint、Visio、HTML 和圖像。

什么是HTML文件格式?

HTML被称为网络语言,随着新信息要求的要求而发展,要求将其显示为网页的一部分。最新的变体被称为 HTML 5,它为使用该语言提供了很大的灵活性。 HTML 页面要么从托管这些页面的服务器接收,要么也可以从本地系统加载。每个 HTML 页面都由 HTML 元素组成,例如表单、文本、图像、动画、链接等。这些元素由标签和其他几个元素表示,每个标签都有开始和结束。它还可以嵌入以 JavaScript 和样式表 (CSS) 等脚本语言编写的应用程序,以实现整体布局表示。

学习

什么是MHTML文件格式?

具有 MHTML 扩展名的文件代表一种网页存档格式,可以由许多不同的应用程序创建。该格式被称为存档格式,因为它将 Web HTML 代码和相关资源保存在单个文件中。这些资源包括链接到网页的任何内容,例如图像、小程序、动画、音频文件等。 MHTML 文件可以在各种应用程序中打开,例如 Internet Explorer 和 Microsoft Word。 Microsoft Windows 使用 MHTML 文件格式记录在 Windows 上使用任何引发问题的应用程序期间观察到的问题场景。 MHTML 文件格式对页面内容进行编码,类似于 message/rfc822 中定义的规范,这是纯文本电子邮件相关规范。格式的实际规范在 RFC 2557 中有详细说明。

学习

Java 的热门 HTML 转换选项

转变 HTML 到 PDF

(便携式文件格式)

转变 HTML 到 IMAGE

(图像文件)

转变 HTML 到 DOC

(Microsoft Word 二进制格式)

转变 HTML 到 DOCX

(Office 2007+ Word 文档)

转变 HTML 到 DOCM

(Microsoft Word 2007 马可文件)

转变 HTML 到 DOT

(Microsoft Word 模板文件)

转变 HTML 到 DOTX

(微软 Word 模板文件)

转变 HTML 到 DOTM

(Microsoft Word 2007+ 模板文件)

转变 HTML 到 TXT

(文本文件)

转变 HTML 到 RTF

(富文本格式)

转变 HTML 到 XLS

(Microsoft Excel 电子表格(旧版))

转变 HTML 到 XLSX

(打开 XML 工作簿)

转变 HTML 到 XLSM

(启用宏的电子表格)

转变 HTML 到 XLSB

(Excel 二进制工作簿)

转变 HTML 到 XLT

(Excel 97 - 2003 模板)

转变 HTML 到 XLTX

(Excel 模板)

转变 HTML 到 XLTM

(Excel 启用宏的模板)

转变 HTML 到 TSV

(制表符分隔值)

转变 HTML 到 XLAM

(Excel 启用宏的加载项)

转变 HTML 到 CSV

(逗号分隔值)

转变 HTML 到 DIF

(数据交换格式)

转变 HTML 到 SXC

(StarSuite Calc 电子表格)

转变 HTML 到 PPT

(微软PowerPoint 97-2003)

转变 HTML 到 PPTX

(打开 XML 表示格式)

转变 HTML 到 PPTM

(启用宏的演示文件)

转变 HTML 到 PPS

(幻灯片放映)

转变 HTML 到 PPSX

(幻灯片放映)

转变 HTML 到 PPSM

(启用宏的幻灯片放映)

转变 HTML 到 POT

(Microsoft PowerPoint 模板文件)

转变 HTML 到 POTX

(Microsoft PowerPoint 模板演示文稿)

转变 HTML 到 POTM

(微软 PowerPoint 模板文件)

转变 HTML 到 ODT

(OpenDocument 文本文件格式)

转变 HTML 到 OTT

(OpenDocument 标准格式)

转变 HTML 到 ODS

(OpenDocument 电子表格)

转变 HTML 到 ODP

(OpenDocument 演示格式)

转变 HTML 到 OTP

(OpenDocument 标准格式)

转变 HTML 到 PSD

(Photoshop 文档)

转变 HTML 到 PSB

(Photoshop 大型文档格式)

转变 HTML 到 EMZ

(Windows 压缩增强元文件)

转变 HTML 到 WMZ

(压缩的 Windows 元文件)

转变 HTML 到 SVG

(标量矢量图形)

转变 HTML 到 SVGZ

(压缩的可缩放矢量图形)

转变 HTML 到 XPS

(XML 纸张规格)

转变 HTML 到 TEX

(乳胶源文件)

转变 HTML 到 BMP

(位图图像文件)

转变 HTML 到 PNG

(便携式网络图形)

转变 HTML 到 GIF

(图形交换格式)

转变 HTML 到 JPEG

(联合摄影专家组图片)

转变 HTML 到 TIFF

(标记图像文件格式)

转变 HTML 到 WEBP

(光栅 Web 图像格式)

转变 HTML 到 JP2

(JPEG 2000 核心图像)

转变 HTML 到 ICO

(图标文件)

转变 HTML 到 HTML

(超文本标记语言)

转变 HTML 到 HTM

(超文本标记语言文件)

转变 HTML 到 MHT

(MHTML 网络档案)

转变 HTML 到 MHTML

(网页存档格式)

转变 HTML 到 MD

(降价语言)

转变 HTML 到 DCM

(DICOM 图像)

转变 HTML 到 EMF

(增强的元文件格式)

转变 HTML 到 WMF

(Windows 元文件)

转变 HTML 到 TGA

(Truevision 图形适配器)

转变 HTML 到 EPUB

(打开电子书文件)

转变 HTML 到 FODS

(OpenDocument 平面 XML 电子表格)

转变 HTML 到 DICOM

(医学中的数字成像和通信)

转变 HTML 到 MPP

(微软项目文件)

转变 HTML 到 MPX

(FoxPro 编译程序菜单)

转变 HTML 到 XER

(Primavera P6 项目文件)

转变 HTML 到 PCL

(打印机命令语言文档)

转变 HTML 到 PS

(PostScript 文件)

转变 HTML 到 MSG

(Outlook 邮件项目文件)

转变 HTML 到 EMLX

(苹果邮件信息)

转变 HTML 到 AZW3

(亚马逊 KF8 电子书文件)

转变 HTML 到 MOBI

(打开电子书格式)

转变 HTML 到 DXF

(Autodesk 工程图交换格式)

 中国人