0

需要托管 8000 万个 tiff 文件(每个 1000 KB)大约 10 兆字节,这将是最好的文档管理解决方案。这些文件需要位于文件系统上,但希望通过文档管理系统(Sharepoint、Documentum、Filenet 等)进行索引。我们已经有了 CSV 格式的索引,并希望重用这些索引,而不是爬过 8000 万个文件并重新创建索引。

4

3 回答 3

1

SharePoint 2010 可以处理这么大的文档库 - 并且可以在 WSS3/MOSS2007 版本下通过一些仔细的规划和架构来完成。

我不太熟悉 Documentum,但在 SharePoint 领域,我会创建一个自定义内容类型,将 CSV 的字段映射到 SharePoint 的字段,然后使用新的类型。有了这么多数据,我会认真考虑将其分解为多个网站集和/或查看远程 Blob 存储 API:http ://technet.microsoft.com/en-us/magazine/2009.06.insidesharepoint.aspx

于 2009-12-26T17:03:18.303 回答
0

我认为最好将索引传输到 SQL Server 等数据库并将文件保存在文件系统中。然后可以在这些索引上构建 DMS(文件上传/访问等)。

于 2009-12-26T16:35:45.253 回答
-2

我会看看像Hadoop这样的东西。可以在 Amazon Elastic Compute Cloud (EC2) 和 Amazon Simple Storage Service (S3) 上运行 Hadoop]。看看Hadoop,参考纽约时报如何使用 100 个 Amazon EC2 实例和 Hadoop 应用程序在 24 小时内将 4TB 的原始图像 TIFF 数据(存储在 S3 中)处理成 1100 万个完成的 PDF 的示例计算成本约为 240 美元(不包括带宽)。 [14]

于 2009-12-26T16:53:14.390 回答