0

谁能告诉我,索引服务中的噪声词到底是什么意思?我正在研究 Windows 服务器索引服务并遇到很多问题。 Some questions on it: Does indexing services not search for noise words? What is the location and name of noise word file on windows server? 谢谢。

4

1 回答 1

0

它们与停用词相同:

https://en.wikipedia.org/wiki/Stop-words

在计算中,停用词是在处理自然语言数据(文本)之前或之后被过滤掉的词。没有一个所有工具都使用的明确的停用词列表,并且并不总是使用这样的过滤器。一些工具特别避免删除它们以支持短语搜索。

也可以看看:

http://msdn.microsoft.com/en-us/library/ms693206%28v=vs.85%29.aspx

噪声词在短语查询中充当占位符。包含文本“wag the dog”的文档存储在索引中,出现 1 处为“wag”,出现 3 处为“dog”。短语查询“wag dog”不匹配,但短语查询“wag a dog” " 会,因为发生信息匹配

于 2013-12-10T11:44:31.163 回答