20

我正在开发一个 Web 应用程序,用户可以在其中上传 Microsoft Office 文档文件。现在,我们的服务器正在运行带有 Express.js 的 Node.JS,并且我们托管在 Heroku 上。正因为如此,我不认为我可以安装诸如 abiword 或 catdoc 之类的程序。我可以处理文件上传,但无法解析文档的内容。

如何读取 doc 文件的内容?然后将信息放入数据库中。保留基本格式(粗体、斜体、下划线)会很好,但不是必需的。

4

4 回答 4

7

虽然 NPM 似乎没有任何东西可以直接执行 Word,但您可以使用 REST API 通过另一个云服务请求它。例如Saaspose(著名的 Aspose 工具)拥有WordExcelPDF等的公共 API。他们在其页面上列出了 node.js、javascript 和 Heroku 支持。

编辑:

我看到 Saaspose 现在被称为Aspose for Cloud

另一个声称类似的 API 是Doxument

于 2012-10-15T23:21:18.217 回答
5

办公包:npm install office似乎至少提供了部分答案。我用它来读取 Excel 文件,到目前为止还没有尝试过任何 Word 文档。

于 2012-10-27T17:39:02.123 回答
2

似乎还没有。请参阅下面的内容可能会有所帮助。

我可以使用 Node.js 阅读 PDF 或 Word 文档吗?

于 2012-10-15T19:44:34.937 回答
2

您可以使用 mammoth 解析 .docx 文件https://www.npmjs.com/package/mammoth 和 xlsx 解析 .xlsx 文件https://github.com/SheetJS/js-xlsx

于 2018-08-21T14:29:03.497 回答