我正在尝试将 PDF 文档转换为 java 中的单个 HTML 文件。大多数在线转换器将一个 PDF 文件转换为多个 HTML 文件。我想将整个 PDF 转换为单个 HTML 文件。
有什么建议么?
我正在尝试将 PDF 文档转换为 java 中的单个 HTML 文件。大多数在线转换器将一个 PDF 文件转换为多个 HTML 文件。我想将整个 PDF 转换为单个 HTML 文件。
有什么建议么?
有什么建议么?
您可能总是使用JSoup API 编写一些代码来编写包含body
多个 HTML 文件中的每一个的单个文档。组合样式和样式表 (CSS) 可能有点棘手(尤其是如果原始 HTML 使用 'id' 元素)。
虽然我很难相信没有一个转换器可以选择“单个文档”。我建议进一步搜索。
我认为应该可以用itext解析您的 PDF 文档,然后生成您的 html 文件。我必须承认我还没有检查它是否可行。
你看过http://www.jpedal.org/html_index.php有一个选项来写入单个文件。