1. Các sản phẩm
  2.   Conholdate.Total
  3.   Java
  4.   Chuyển đổi DOCX sang DOCX qua Java hoặc Ứng dụng trực tuyến

Chuyển đổi DOCX sang DOCX qua Java hoặc Ứng dụng trực tuyến

Lập trình chuyển đổi DOCX sang HTML trong các ứng dụng Java & J2SE bằng cách sử dụng các tùy chọn thao tác tài liệu linh hoạt để tùy chỉnh giao diện của tài liệu kết quả. Thư viện chuyển đổi tài liệu Word giúp chuyển đổi chính xác các định dạng tài liệu Word sang PDF, bảng tính Excel, trình chiếu PowerPoint, Photoshop, HTML, eBook, XML, hình ảnh và nhiều định dạng tệp phổ biến khác. Sử dụng nhiều tính năng chuyển đổi tài liệu - chuyển đổi toàn bộ tài liệu hoặc chọn các trang cụ thể của tệp tài liệu nguồn dựa trên số trang hoặc phạm vi trang tự chọn và dễ dàng chuyển đổi sang định dạng tài liệu được hỗ trợ mà không cần sử dụng bất kỳ phần mềm bên ngoài nào.

Tải xuống

Cách chuyển đổi DOCX sang HTML trong Java

Thực hiện chuyển đổi tệp DOCX sang HTML trong Java bằng ba bước đơn giản. Xem tài liệu MHTML đã chuyển đổi như nó vốn có hoặc hiển thị và hiển thị dưới dạng HTML mà không cần sử dụng bất kỳ phần mềm bên ngoài nào.

Nhận các tệp lắp ráp tương ứng từ tải xuống hoặc tìm nạp toàn bộ gói từ Maven đến thêm Conholdate.Total cho Java trực tiếp trong không gian làm việc của bạn.

  • Tạo một phiên bản mới của lớp Converter và tải tệp DOCX
  • Đặt ConvertOptions cho loại tài liệu HTML
  • Gọi phương thức Convert của Converter class instance để chuyển đổi sang HTML
  • Đặt các tùy chọn cho trình xem HTML
  • Tạo đối tượng Viewer để xem HTML được chuyển đổi dưới dạng HTML

Ứng dụng miễn phí cho Chuyển đổi DOCX sang HTML



Thêm Watermark vào Word & Chuyển đổi sang PDF

Chính xác chuyển đổi tài liệu Word sang PDF trong Java, chính xác như tệp nguồn ban đầu và áp dụng hình mờ văn bản hoặc hình ảnh sang PDF các trang tài liệu.

  • Tạo phiên bản mới của lớp Converter để chuyển đổi tài liệu Word DOCX
  • Khởi tạo lớp ConvertOptions thích hợp (PdfConvertOptions, WordProcessingConvertOptions, SpreadsheetConvertOptions)
  • Tạo phiên bản mới của lớp WatermarkOptions
  • Chỉ định các thuộc tính hình mờ (màu sắc, chiều rộng, chiều cao, văn bản, hình ảnh, v.v.)
  • Đặt thuộc tính Watermark của đối tượng ConvertOptions
  • Gọi phương thức Convert của Converter phiên bản lớp để chuyển đổi Word sang PDF

Tải và chuyển đổi tài liệu được định vị từ xa

Sử dụng Conholdate.Total for Java - các nhà phát triển có thể tải và chuyển đổi tài liệu từ nhiều vị trí từ xa khác nhau và các tài nguyên lưu trữ tài liệu đám mây như Amazon S3, Microsoft Azure Blob, FTP, đĩa cục bộ, luồng hoặc một URL đơn giản. Chỉ cần chỉ định phương thức để lấy dòng tài liệu được định vị từ xa và sau đó chuyển nó vào lớp Converter như một phương thức khởi tạo.

Conholdate.Tổng số cho các API Java được hỗ trợ trên các hệ điều hành khác nhau như Windows J2SE, Linux (Ubuntu, OpenSUSE, CentOS và các hệ điều hành khác), macOS và bất kỳ loại ứng dụng Java nào dựa trên môi trường phát triển Eclipse, IntelliJ NetBeans, IntelliJ IDEA hoặc Visual Studio Code.


Chuyển đổi Word sang PDF được bảo vệ bằng mật khẩu

Nhanh chóng tải và chuyển đổi tài liệu Word được bảo vệ bằng mật khẩu sang PDF trong các ứng dụng dựa trên Java của bạn - tất cả những gì bạn cần chỉ là vài dòng của mã. Các nhà phát triển cũng có thể chuyển đổi tài liệu Word (DOC hoặc DOCX) sang các định dạng khác như Web (HTML, MHTML), Hình ảnh (JPG, PNG TIFF, BMP), Markdown và nhiều định dạng khác mà không cần cài đặt Microsoft Word.

  • Tạo phiên bản mới của lớp Converter và chuyển đường dẫn tài liệu nguồn
  • Khởi tạo lớp ConvertOptions thích hợp, ví dụ: (PdfConvertOptions, WordProcessingConvertOptions, SpreadsheetConvertOptions, v.v.)
  • Gọi phương thức Convert của cá thể lớp Converter và chuyển tên tệp cho tài liệu được chuyển đổi

Trích xuất thông tin tài liệu DOCX

Tính năng trích xuất thông tin tài liệu không chỉ cho phép lấy thông tin cơ bản về tệp tài liệu nguồn mà nó còn hỗ trợ trích xuất một số thông tin cụ thể có định dạng tệp có giá trị. Nó bao gồm ngày bắt đầu và ngày kết thúc dự án của tệp Microsoft Project, bất kỳ hạn chế in nào trên tài liệu PDF, danh sách các thư mục trong tệp dữ liệu Outlook và thông tin về các lớp và bố cục trong tài liệu CAD.

Một tính năng hữu ích khác của Conholdate.Total Java APIs để chuyển đổi tài liệu là tự động phát hiện phần mở rộng định dạng tệp không xác định của tài liệu nguồn được phân phối dưới dạng luồng byte.


Chuyển đổi các trang từ cụ thể sang PDF trong Java

API chuyển đổi tài liệu Java cho phép bạn chọn các trang đã chọn từ tài liệu nguồn và chuyển đổi chính xác sang định dạng tài liệu được hỗ trợ. Ví dụ mã bên dưới cho thấy cách chuyển đổi trang thứ nhất và thứ 4 của tài liệu Word sang tệp PDF kết quả.

  • Tạo một phiên bản mới của lớp Converter và tải tài liệu đầu vào (Word)
  • Khởi tạo lớp ConvertOptions thích hợp, ví dụ: (PdfConvertOptions, WordProcessingConvertOptions, SpreadsheetConvertOptions, v.v.)
  • Đặt thuộc tính setPages của phiên bản ConvertOptions và đề cập đến số trang cụ thể sẽ được chuyển đổi
  • Gọi phương thức Convert của phiên bản lớp Converter và chuyển tên tệp (PDF) cho tài liệu được chuyển đổi

Cache DOCX Kết quả tài liệu

Trong một số trường hợp, kích thước tài liệu được chuyển đổi lớn hơn và cần có thời gian để chuyển đổi. Thư viện chuyển đổi tài liệu cung cấp tính năng bộ nhớ đệm để quản lý hiệu quả các tình huống như vậy và tăng tốc quá trình chuyển đổi lặp đi lặp lại. Cho phép giao diện ICache hoạt động với việc triển khai bộ đệm tùy chỉnh bằng cách sử dụng điểm mở rộng và kiểm soát việc chuyển đổi bộ đệm, tùy thích.

Kết quả chuyển đổi được lưu vào ổ đĩa cục bộ theo mặc định nhưng bất kỳ loại bộ nhớ đệm nào cũng có thể được hỗ trợ bằng cách triển khai các giao diện thích hợp như Amazon S3, Dropbox, Google Drive, Windows Azure, Reddis hoặc bất kỳ loại nào khác.


Các câu hỏi thường gặp

Làm cách nào tôi có thể bắt đầu với Conholdate.Total cho các API Java để chuyển đổi DOCX thành HTML bằng cách sử dụng các trình diễn hoặc ví dụ về mã?

Nền tảng Conholdate.Total dành cho Java cung cấp nhiều tùy chọn và trình diễn khác nhau để chuyển đổi các dự án định dạng tệp xử lý Word bằng GroupDocs hoặc Aspose ví dụ mã. Các lập trình viên Java có thể dễ dàng sử dụng các ví dụ về GroupDocs.Conversion cho cả triển khai giao diện người dùng và phụ trợ hoặc họ có thể tạo các dự án của riêng mình với các tính năng chuyển đổi DOCX thành HTML trong các ứng dụng dựa trên Java.

API nào được sử dụng để chuyển đổi DOCX sang HTML trong đoạn mã như đã chia sẻ ở trên?

Conholdate.Total cho Java bao gồm tất cả các API Java do Aspose và GroupDocs cung cấp. Tuy nhiên, các nhà phát triển có thể sử dụng các API khác nhau để chuyển đổi DOCX thành HTML; để đơn giản hóa, chúng tôi đã minh họa các đoạn mã bằng cách sử dụng GroupDocs.Conversion cho Java.

Định dạng tệp tài liệu và hình ảnh nào được Conholdate.Total cho Java hỗ trợ?

Conholdate.Total cho Java tích hợp các API từ Aspose và GroupDocs để cho phép các lập trình viên Java thực hiện các thao tác xử lý tài liệu khác nhau trên nhiều định dạng tệp bao gồm Word, Excel, PDF, PowerPoint, Visio, HTML và hình ảnh trong các ứng dụng dựa trên Java & J2SE.

Tôi có thể chuyển đổi tài liệu DOCX được bảo vệ bằng mật khẩu sang HTML bằng API này không?

Tuyệt đối! API Conholdate.Total xử lý liền mạch việc chuyển đổi tài liệu DOCX được bảo vệ bằng mật khẩu. Trong quá trình chuyển đổi, bạn có thể chỉ cần cung cấp mật khẩu bằng các tùy chọn tải cụ thể khi thiết lập trình chuyển đổi. Điều này đảm bảo chuyển đổi an toàn và hiệu quả ngay cả đối với các tệp DOCX được mã hóa.

Tôi có thể chỉ chuyển đổi một số trang nhất định từ tài liệu DOCX sang HTML trong Java không?

Chắc chắn rồi! Bằng cách sử dụng các tùy chọn chuyển đổi, bạn có thể chuyển đổi toàn bộ tài liệu DOCX hoặc chỉ các trang được chọn sang định dạng HTML một cách hiệu quả.

Tôi có thể tùy chỉnh tệp HTML đầu ra khi chuyển đổi từ tài liệu DOCX không?

Vâng, bạn chắc chắn có thể! API Conholdate.Total trao quyền cho bạn vượt xa khả năng chuyển đổi cơ bản, cung cấp các tùy chọn tùy chỉnh cho tệp HTML của bạn. Tinh chỉnh chất lượng hình ảnh, thêm hình mờ bảo mật và khám phá các tính năng khác để điều khiển giao diện của đầu ra HTML theo nhu cầu chính xác của bạn.

Định dạng tệp DOCX là gì?

DOCX là định dạng tệp được sử dụng để lưu trữ các tài liệu được tạo trong Microsoft Word. Nó là sự kế thừa của định dạng DOC trước đó và là một phần của định dạng Microsoft Office Open XML. Đây là định dạng tệp chính được sử dụng bởi Microsoft Word 2007 và các phiên bản mới hơn, đồng thời được giới thiệu cùng với Microsoft Office 2007 vào ngày 17 tháng 1 năm 2007. Định dạng tệp DOCX dựa trên Quy ước Đóng gói Mở (OPC), một định dạng tệp dựa trên XML mở cho tài liệu văn phòng được tạo bởi Microsoft. Định dạng DOCX sử dụng hỗn hợp cấu trúc tệp ZIP chứa các tệp XML để lưu trữ dữ liệu của nó. OPC là một định dạng được thiết kế để lưu trữ nội dung kỹ thuật số ở định dạng tệp tiêu chuẩn, có thể được sử dụng và chia sẻ trên các ứng dụng tương thích khác nhau. Các tệp DOCX được lưu ở định dạng tệp ZIP, đây là định dạng tệp lưu trữ được sử dụng rộng rãi. Bằng cách nén dữ liệu bằng định dạng nén ZIP, tài liệu DOCX có thể có kích thước nhỏ hơn nhiều so với định dạng tệp DOC gốc. Điều này làm cho chúng dễ dàng hơn nhiều để lưu trữ, chuyển và chia sẻ trên internet. DOCX là định dạng tệp ưa thích trong hầu hết các chương trình văn phòng, vì nó dễ sử dụng hơn, tạo nhanh hơn và dễ chuyển hơn. Nó cũng dễ xem và mở hơn trên nhiều ứng dụng và thiết bị, bao gồm cả điện thoại thông minh, máy tính bảng và PC. DOCX là một định dạng tệp quan trọng vì nó cho phép tương thích dễ dàng hơn giữa các ứng dụng khác nhau. Không có nó, người dùng sẽ phải dựa vào các định dạng độc quyền không tương thích với các ứng dụng khác. Do đó, DOCX là một công cụ có giá trị cho những người trong thế giới kinh doanh.

Học

Định dạng tệp HTML là gì?

HTML (Ngôn ngữ đánh dấu siêu văn bản) là ngôn ngữ đánh dấu tiêu chuẩn được sử dụng để tạo các trang web. Nó là nền tảng của bất kỳ trang web nào và là ngôn ngữ đầu tiên được sử dụng để tạo tài liệu kỹ thuật số trên internet. HTML được sử dụng để cung cấp cấu trúc cho văn bản, hình ảnh, âm thanh và video trên các trang web. Tài liệu HTML được tạo thành từ hai loại tệp: HTML và CSS. Các tệp HTML chứa đánh dấu cho cấu trúc của tài liệu và các tệp CSS chứa thông tin kiểu để định dạng các phần tử HTML. Đánh dấu HTML được viết dưới dạng thẻ. Các thẻ này cho trình duyệt biết cách hiển thị nội dung trên trang. Các thẻ HTML dễ nhận biết bao gồm đầu, thân, tiêu đề, h1 và p. Các tệp HTML kết thúc bằng phần mở rộng tệp .html. Theo mặc định, tài liệu HTML sẽ mở trong trình duyệt web khi người dùng nhấp vào tệp. Tài liệu HTML cũng có thể được xem trong trình soạn thảo văn bản, chẳng hạn như Notepad++ hoặc Sublime Text. Khi tạo các trang web, cả HTML và CSS đều phải được sử dụng để xây dựng trang. HTML cung cấp cấu trúc, trong khi CSS cung cấp kiểu dáng. Cùng với nhau, chúng tạo thành xương sống của web và giúp các tài liệu kỹ thuật số có thể được xem trong trình duyệt web.

Học

Tùy chọn chuyển đổi DOCX phổ biến với Java

Chuyển thành DOCX đến PDF

(Định dạng tài liệu di động)

Chuyển thành DOCX đến IMAGE

(Tập tin hình ảnh kỹ thuật số)

Chuyển thành DOCX đến DOC

(Định dạng nhị phân Microsoft Word)

Chuyển thành DOCX đến DOCX

(Văn phòng 2007+ Tài liệu Word)

Chuyển thành DOCX đến DOCM

(Tệp Marco Microsoft Word 2007)

Chuyển thành DOCX đến DOT

(Tệp mẫu Microsoft Word)

Chuyển thành DOCX đến DOTX

(Tệp mẫu Microsoft Word)

Chuyển thành DOCX đến DOTM

(Tệp mẫu Microsoft Word 2007+)

Chuyển thành DOCX đến TXT

(Dữ liệu văn bản)

Chuyển thành DOCX đến RTF

(Định dạng văn bản phong phú)

Chuyển thành DOCX đến HTML

(Ngôn ngữ đánh dấu siêu văn bản)

Chuyển thành DOCX đến MHTML

(Định dạng lưu trữ trang web)

Chuyển thành DOCX đến HTM

(Tệp ngôn ngữ đánh dấu siêu văn bản)

Chuyển thành DOCX đến MHT

(Lưu trữ web MHTML)

Chuyển thành DOCX đến XLS

(Bảng tính Microsoft Excel (Cũ))

Chuyển thành DOCX đến XLSX

(Mở sổ làm việc XML)

Chuyển thành DOCX đến XLSM

(Bảng tính hỗ trợ macro)

Chuyển thành DOCX đến XLSB

(Sổ làm việc nhị phân Excel)

Chuyển thành DOCX đến XLT

(Mẫu Excel 97 - 2003)

Chuyển thành DOCX đến XLTM

(Mẫu hỗ trợ macro Excel)

Chuyển thành DOCX đến XLAM

(Phần bổ trợ hỗ trợ Macro của Excel)

Chuyển thành DOCX đến CSV

(Giá trị được phân tách bằng dấu phẩy)

Chuyển thành DOCX đến TSV

(Các giá trị được phân tách bằng tab)

Chuyển thành DOCX đến FODS

(OpenDocument Bảng tính XML phẳng)

Chuyển thành DOCX đến DIF

(Định dạng trao đổi dữ liệu)

Chuyển thành DOCX đến SXC

(Bảng tính StarOffice Calc)

Chuyển thành DOCX đến PPT

(Microsoft PowerPoint 97-2003)

Chuyển thành DOCX đến PPTX

(Định dạng bản trình bày XML mở)

Chuyển thành DOCX đến PPS

(Trình chiếu PowerPoint)

Chuyển thành DOCX đến PPSX

(Trình chiếu PowerPoint)

Chuyển thành DOCX đến PPSM

(Trình chiếu kích hoạt macro)

Chuyển thành DOCX đến POT

(Tệp mẫu Microsoft PowerPoint)

Chuyển thành DOCX đến POTX

(Bản trình bày mẫu Microsoft PowerPoint)

Chuyển thành DOCX đến PPTM

(Tệp trình bày hỗ trợ macro)

Chuyển thành DOCX đến POTM

(Tệp mẫu Microsoft PowerPoint)

Chuyển thành DOCX đến ODT

(Định dạng tệp văn bản OpenDocument)

Chuyển thành DOCX đến OTT

(Định dạng chuẩn OpenDocument)

Chuyển thành DOCX đến ODS

(Bảng tính OpenDocument)

Chuyển thành DOCX đến ODP

(Định dạng trình bày OpenDocument)

Chuyển thành DOCX đến OTP

(Định dạng chuẩn OpenDocument)

Chuyển thành DOCX đến TIFF

(Định dạng tệp hình ảnh được gắn thẻ)

Chuyển thành DOCX đến JPEG

(Nhóm chuyên gia chụp ảnh chung)

Chuyển thành DOCX đến JPG

(Nhóm chuyên gia chụp ảnh chung)

Chuyển thành DOCX đến PNG

(Đồ họa mạng di động)

Chuyển thành DOCX đến GIF

(Định dạng trao đổi đồ họa)

Chuyển thành DOCX đến BMP

(Tệp hình ảnh bitmap)

Chuyển thành DOCX đến ICO

(Tệp biểu tượng)

Chuyển thành DOCX đến WMF

(Siêu tệp Windows)

Chuyển thành DOCX đến EMF

(Định dạng siêu tệp nâng cao)

Chuyển thành DOCX đến WEBP

(Định dạng hình ảnh web raster)

Chuyển thành DOCX đến JP2

(Hình ảnh lõi JPEG 2000)

Chuyển thành DOCX đến EMZ

(Siêu tệp nâng cao được nén của Windows)

Chuyển thành DOCX đến WMZ

(Siêu tệp Windows được nén)

Chuyển thành DOCX đến SVG

(Đồ Họa Véc Tơ Vô Hướng)

Chuyển thành DOCX đến SVGZ

(Đồ họa vector có thể mở rộng được nén)

Chuyển thành DOCX đến TGA

(Bộ điều hợp đồ họa Truevision)

Chuyển thành DOCX đến XPS

(Thông số kỹ thuật giấy XML)

Chuyển thành DOCX đến TEX

(Tài liệu nguồn LaTeX)

Chuyển thành DOCX đến MD

(ngôn ngữ đánh dấu)

Chuyển thành DOCX đến PSD

(tài liệu photoshop)

Chuyển thành DOCX đến PSB

(Photoshop định dạng tài liệu lớn)

Chuyển thành DOCX đến JSON

(Tệp ký hiệu đối tượng JavaScript)

Chuyển thành DOCX đến MOBI

(Mở định dạng sách điện tử)

Chuyển thành DOCX đến PCL

(Tài liệu ngôn ngữ lệnh máy in)

Chuyển thành DOCX đến EPUB

(Mở tệp sách điện tử)

Chuyển thành DOCX đến FODP

(Trình bày tài liệu mở)

 Tiếng Việt