我正在用 Django 开发一个网络应用程序。我想使用 Lucene 作为搜索引擎。但是,我想自定义分析器以支持我的目的。例如,一个单词“\(H_2\)”在索引之前应该变成“H2”。我什至不确定这是否是分析器的工作。
我做了谷歌,发现这些页面很有用:
http://packages.python.org/pyes/guide/reference/index-modules/analysis/index.html
http://hi.baidu.com/aruizen/blog/item/7b5fcb2a05ff122cd52af12a.html (从 Python 中“扩展”Java 类)
但我仍然无法理解如何在 Python 中自定义 StandardAnalyzer。如您所见,上面的链接给了我非常不同的代码。
谢谢!