3

我曾与 Lucene 一起为文档建立索引并在其中提供搜索,但是,我的工作是用英语进行的,但现在,我有一个库尔德语项目,库尔德语使用一些阿拉伯 unicode 字符和其他几个字符,这里是表库尔德阿拉伯语脚本中使用的 Unicode 字符

我的问题是如何为这种语言创建分析器,或者我可以为此目的使用阿拉伯语分析器吗?

4

2 回答 2

1

要回答有关如何为新语言创建自定义分析器的问题...“Lucene In Action”一书涵盖了自定义分析器的创建,并且非常详细。您可以“利用”在其他分析器中找到的大量代码,只需更改您需要的内容。Lucene 是开源的并且非常可扩展,因此分析这些更改非常容易。

于 2012-12-27T15:40:32.107 回答
1

Lucene 有一个其他分析器列表,包括阿拉伯语。恐怕没有人专门针对库尔德人,但也许您可以扩展阿拉伯语分析器以满足您的需求?

请记住,所有这些分析器都与主要的 Lucene 发行版分开。

于 2012-12-24T10:51:47.243 回答