哪个 lucene 分析器可以用来正确处理日文文本?它应该能够处理汉字、平假名、片假名、罗马字以及它们的任何组合。
问问题
3271 次
2 回答
4
您可能应该查看 Lucene 的 contrib 区域中的CJK包。有专门用于处理中文、日文和韩文的分析器和标记器。
于 2009-10-26T14:33:32.943 回答
3
我在为自己的目的进行搜索时发现了lucene-gosen :
他们的例子看起来相当不错,但我想这是需要大量测试的东西。我也担心他们的向后兼容政策(或者更确切地说,完全没有一个。)
于 2011-10-18T04:54:22.150 回答