-2

我正在寻找能够同时将大量(数千).pdf 转换为 .html 或 .doc 的代码片段或其他解决方案:

  • 维护标题的层次结构
  • 捕获文档中的图像,将它们上传到图像服务器并创建指向它的绝对链接,并维护表格格式。

是否存在这样的工具,如果存在,是谁制造的?如果不是,我可以与哪些领域的思想领袖联系?

4

1 回答 1

0

检查pdftohtml

然后,您可以在它周围添加一些脚本来进行批量转换。

不过,结果并不是那么好。

于 2014-12-31T16:54:54.133 回答