0

作为狮身人面像的新手,请原谅任何错误或滥用的术语。

Sphinx 正在一个基于网络的应用程序中使用,该应用程序具有数百万条记录的数据库,以提供全文搜索功能。

对于存储在数据库中的英文内容,搜索结果是“准确的”并且与搜索关键字相关。非拉丁字符不会发生同样的事情。我查看了形态配置设置,但希腊语不可用。因此,对于希腊关键词,搜索结果并不总是与搜索关键词相关,如英语中的关键词。

sphinx 对希腊内容的文本分析和索引是否与对英语内容的方式相同?

任何信息(链接、评论、答案)都会有所帮助。

谢谢,

4

1 回答 1

1

这很可能受 charset_type 和 charset_table 配置的影响。

http://sphinxsearch.com/docs/current.html#conf-charset-type

http://sphinxsearch.com/docs/current.html#conf-charset-table

开箱即用的 sphinx 仅适用于英语和俄语(主要 Sphinx 开发人员碰巧说的语言 :)

因此,您需要启用 utf8 模式,并将所需的希腊字符添加到 charset_table。

sphinx wiki http://sphinxsearch.com/wiki/doku.php?id=charset_tables 有一组可以复制/粘贴的希腊配置选项。

于 2012-09-27T16:03:50.087 回答