我有一个需要启用搜索的大型设置文件 (hdf)。对于 Java,我会使用 Lucene,因为它是一个文件和文档索引引擎。我不知道python等价物是什么。
谁能推荐我应该使用哪个库来索引大量文件以进行快速搜索?或者是自己滚动的首选方式?
我看过pylucene和lupy,但是这两个项目似乎相当不活跃且不受支持,所以我不确定是否应该依赖它们。
最后说明: Woosh 和 pylucene 看起来很有希望,但是 woosh 仍然是 alpha,所以我不确定我是否要依赖它,而且我在编译 pylucene 时遇到了问题,并且没有实际的发布。在我查看了更多数据之后,它主要是数字和默认文本字符串,所以现在关闭索引引擎对我没有帮助。希望这些库能够稳定下来,以后的访问者会发现它们有一些用处。