0

我的公司收集了大约 3500 个高度结构化的 Word 文档(并且还在不断增加),其中包含来自我们产品之一的多项选择题。我的任务是编写一个前端,让人们可以在其他产品中找到并使用这些前端。它们上有一些元数据可以放入数据库,但我们也想要全文搜索。

我可以选择在前端使用 MS Access(因为我很了解它)或 Rails(因为我应该学习它)。我已经完成了一个 Rails 应用程序,并且更愿意继续使用它。

与其将文档加载数据库中,我认为将它们放在文件系统上并将它们的路径存储在数据库中更有意义。

我知道我可以使用 Ferret 搜索数据库字段,但是将全文搜索添加到 Rails 应用程序以查找文件系统上的一堆文件的最佳方法是什么?

4

1 回答 1

0

不确定是否有任何宝石可以为您搜索单词文件。尽管您已经提到您不想将整个文档加载到数据库中,但您可能会考虑仅复制 db.xml 中每个文件的文本内容。您可以使用 win32ol 库来执行此操作(http://ruby-doc.org/stdlib/libdoc/win32ole/rdoc/classes/WIN32OLE.html).. 如果我必须实现这个,我会每天晚上运行一个 cron 作业(或任何看起来合适的频率),这将使用 word 文件中的更改刷新数据库内容。

于 2011-07-14T21:49:55.147 回答