3

我有一个每月生成大约 10000 个打印页的应用程序。每个报告(大约 2000 个/月)都以 PDF 格式存档在一个简单的网络文件共享中。我正在寻找满足以下要求的文档管理系统:

  • 观察存档文件夹并定期或在检测到更改时更新索引
  • 提供一个 Intranet 网页,用户可以在其中根据文件名、时间跨度和其他相关文件属性搜索文档
  • 全文检索
  • 可以处理大型/大量增长的档案

需要明确的是,我在这里寻找一个预先构建的解决方案,接受商业产品。

4

5 回答 5

2

听起来Microsoft Search Server 2008 Express将是一个不错的选择。免费并在几分钟内安装。

于 2009-10-24T14:13:26.993 回答
1

我可以建议你谷歌文档。AFAIK 它可以满足您的所有要求。

于 2009-10-24T12:14:28.660 回答
1

这是一个非常模糊的问题,我不太确定如何回答。

看起来您想要一种方法来索引所有文件并确保数据库中的信息保持最新。我可以建议您查看一些搜索服务器,例如:

狮身人面像

索尔

这些都需要一些设置,但它们可以满足您的所有要求:它们可以轻松设置为查看文件夹并保持索引最新,它们提供了很好的全文搜索,如果您设置一个页面进行搜索,它们可以通过 Intranet 网页访问您的数据库,它们用于大量操作,因此大型档案应该不是问题。

如果您正在寻找预先构建的解决方案,我不知道该提什么。

于 2009-10-24T12:18:53.813 回答
1

Plone可以很好地满足您的需求。它具有用于索引 PDF 内容的插件,并且您可以自定义元数据。此外,它还有一个带有内置搜索功能的出色网络界面。最好的部分是它是免费且易于使用的,如果您的需求增长,您可以支付支持费用。

我唯一的建议(乍一看)是您将内容存储在文件系统上,而不是Zope OO 数据库中。您应该只将元数据和索引数据存储在数据库中。这是在文档管理世界中存储大量内容的一种非常常见的方式。

希望有帮助!

汤姆·普尔

于 2009-10-24T19:19:14.490 回答
0

正如汤姆所说,Plone 对你所描述的做了。它内置了全文搜索,该搜索依赖于命令行程序 pdftotext 以使 pdf 位于路径中。您可能对以下几个扩展感兴趣:

(抱歉,由于 stackoverflows 新用户政策,缺少链接)

于 2009-10-31T14:25:56.787 回答