我们正在寻找一种解决方案,使我们能够索引和存储数百万个 PDF 文件。我们目前使用 Lucene+Tika,但将文件系统上的 PDF 存储为 blob(ZODB blob)。
Crate.io 可以用于索引和存储大量(数百万)PDF 文件吗?
我们正在寻找一种解决方案,使我们能够索引和存储数百万个 PDF 文件。我们目前使用 Lucene+Tika,但将文件系统上的 PDF 存储为 blob(ZODB blob)。
Crate.io 可以用于索引和存储大量(数百万)PDF 文件吗?
是的,当然,这是 crate 真正适合的一种场景。也许这个最近的功能请求/讨论对你来说也很有趣:https ://github.com/crate/crate/issues/1206