5

我想为一个用 Django 编写的网站实现搜索解决方案。从可用选项(我研究过 Solr、Sphinx、Xapian、PostgreSQL/Tsearch3、MySQL)来看,Sphinx 看起来是最好的。但是,它不支持波兰语的词干提取,这是我想要搜索的数据语言。

在 Sphinx 中处理不受支持的语言的最佳方法是什么?我有一种直觉,我可以从 Ispell 词典中创建一个词干语料库。我怎样才能使它与 Sphinx 一起工作?

4

1 回答 1

0

http://snowball.tartarus.org/mailist中搜索,如果有人尝试创建波兰词干分析器,您可能会找到一些信息。有 2 个免费的词干分析器可用,但它们是用 java 制作的(我认为至少有一个是为 solr/lucene 制作的)。在 Ispell 中,我不确定词干提取语料库是否可以帮助您,您可以创建用于 wordforms 或 excepts 的文件。

于 2011-09-26T12:49:55.377 回答