在创建了一个带有简单模式的 whoosh 索引并为 150 万条记录编制索引后,我在 15 秒内获得了接近 1000 个搜索结果。
schema = Schema(tax_id=STORED, name=TEXT(stored=True))
MAIN*.seg 文件的大小约为 190 Mb。
我搜索的方式如下
ix=open_dir("index")
with ix.searcher() as searcher:
query = QueryParser("name", ix.schema).parse(u'putrefaciens')
results = searcher.search(query)
我想知道这种性能是否符合预期,我们可以在给定索引大小的情况下使用 whoosh 进行更快的全文搜索。