我想实现一个需要解析 word 文档的功能,该功能将由用户上传并存储在 amazon S3 上。该应用程序将在 heroku 上。我试过 catdoc 但它不解析网址。任何人都可以建议可以在heroku上使用来解析word文档的工具吗?
更新我想扫描一个上传的 ms-word(.doc) 有特定的单词并相应地标记它们。
我想实现一个需要解析 word 文档的功能,该功能将由用户上传并存储在 amazon S3 上。该应用程序将在 heroku 上。我试过 catdoc 但它不解析网址。任何人都可以建议可以在heroku上使用来解析word文档的工具吗?
更新我想扫描一个上传的 ms-word(.doc) 有特定的单词并相应地标记它们。
如果您只是想上传 word 文档,您可以查看类似回形针 gem之类的东西。
这将允许您将文件保存在 amazon S3 上并简单地下载它,但您也可以扩展回形针并对文件运行后处理。这稍微复杂一些。
就像 willglynn 说的那样,确切地知道你需要做什么解析会很好吗?