我在 Elasticsearch 中使用了带有“Phonetic Token Filter”的Metaphone和soundex编码器。
Metaphone适合英语单词。
Soundex适用于英语以及印地语,也许还有许多其他语言。
我想知道哪些编码器最适合印地语以及其他印度语言(如果可能)?
- 声讯
- 变音器
- 双变位音
- 精炼的_soundex
- caverphone1 - 英语(新西兰本地化)
- caverphone2 - 英语(新西兰本地化)
- 科隆 - 德语
- nysiis - 即兴的 Soundex
- koelnerphonetik - 德语
- haasephonetik - 德语
- beider_morse - 英语和多种欧洲语言
- daitch_mokotoff - 斯拉夫和意第绪语姓氏
由于Elasticsearch 网站上没有列出我们应该为哪种语言选择哪种编码器。
还请告诉我您已经使用了哪些编码器以及用于哪种语言。