Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
如果我想支持所有语言的全文搜索,我应该使用哪种词干提取语言。据我所知,需要使用该特定词干语言创建索引以支持使用该语言进行搜索,但这对我来说是不可能的,因为我的搜索程序可能包含不同的语言
-- 马诺伊
词干并不是一个适用于所有语言的概念。例如,它不适用于中文。但是对于印欧语系的语言(Snowball 网站上的大多数词干分析器都是针对印欧语系的),确实出现了一种常见的词结构模式。假设单词从左到右书写,单词的词干或词根在左侧,并且可以在右侧添加零个或多个后缀。如果根被这个过程修改,它通常会在它的右手端。并且还可以在左侧添加前缀。
@资源:雪球网站