谁能告诉我,索引服务中的噪声词到底是什么意思?我正在研究 Windows 服务器索引服务并遇到很多问题。 Some questions on it: Does indexing services not search for noise words? What is the location and name of noise word file on windows server?
谢谢。
问问题
623 次
1 回答
0
它们与停用词相同:
https://en.wikipedia.org/wiki/Stop-words
在计算中,停用词是在处理自然语言数据(文本)之前或之后被过滤掉的词。没有一个所有工具都使用的明确的停用词列表,并且并不总是使用这样的过滤器。一些工具特别避免删除它们以支持短语搜索。
也可以看看:
http://msdn.microsoft.com/en-us/library/ms693206%28v=vs.85%29.aspx
噪声词在短语查询中充当占位符。包含文本“wag the dog”的文档存储在索引中,出现 1 处为“wag”,出现 3 处为“dog”。短语查询“wag dog”不匹配,但短语查询“wag a dog” " 会,因为发生信息匹配
于 2013-12-10T11:44:31.163 回答