我需要将格式化的 pdf 和 word 文档转换为 html。此转换用于将文档显示到 Web 浏览器中。进入网络浏览器,您还可以选择文本。我不知道在后端(例如使用 Java)或使用 php 是否更好,或者有一个 jquery/javascript 插件?
我的目标是在 iPaper 等网络浏览器中显示这些文档。
谢谢您的帮助
您可以使用pdftohtml并自动在服务器端运行它,或者用它批处理您的 pdf。
这是我正在改进的 PowerShell 解决方案:
https://github.com/suzumakes/ReplaceIT
如果您遇到的问题是 Word 吐出大量垃圾并声称它是一个 HMTL 文件,那么这应该会有很大帮助。iPaper 拥有如此庞大的团队是有原因的,那是因为您希望从文档中构建网页,通过单击按钮打印到网络,结果证明这非常困难。