在我们的项目中,我们的数据容量很高(100Gb 的数据),我们使用 sql 作为 dbms 。不幸的是,sql server 中的全文搜索相当令人失望,所以我们使用 lucene 来搜索我们的数据。但问题是 lucene 需要索引数据,因此同时保存 lucene 索引和我们的数据库的容量会占用太多磁盘空间。所以我想知道我们可以把 sql server 放在一边,只使用 lucene 吗?它是否足够稳定以容纳数百万条数据记录?
问问题
161 次
2 回答
2
如果你想要全文搜索,你需要有全文索引,无论它位于何处。
但是,由于您有空间问题,我假设您在架构字段中使用了 stored="true" 。
将其存储在 db 中(最好是 MSSQL 以外的其他东西)并在 Solr/Lucene 中对其进行索引。
于 2012-08-27T14:19:06.663 回答
1
您可能想看看RavenDB。它速度极快,基于 Lucene,可以作为独立数据库运行。更不用说制造商喜欢把它置于各种压力之下。
只有“缺点”:它是商业的,所以它会花费你 :)
于 2012-08-29T22:20:07.213 回答