有没有办法查询全文索引来帮助确定额外的干扰词?我想添加一些自定义干扰词,并想知道是否有一种方法来分析索引以帮助确定建议。
问问题
868 次
2 回答
0
我决定研究 lucene.net,因为我对 sql server 全文索引中的相关性计算不满意。
我设法弄清楚如何快速索引所有内容,然后使用 Luke 来查找干扰词。我现在已经根据这个分析编辑了 sql server 噪声文件。现在我有一个使用 sql server 全文索引可以很好地工作的搜索解决方案,但我计划将来转移到 lucene.net。
使用 sql server 全文索引作为基础,我开发了一种以域为中心的方法来使用我理解的工具查找相关内容。经过一些认真的思考和测试,我使用了许多其他措施来确定搜索结果的相关性,而不是通过分析文本内容的词频和词距来确定搜索结果的相关性。SQL Server 全文索引为我提供了一个很好的开端,现在我有了一个可以使用 lucene 表达的策略,并且效果很好。
理解 lucene 并制定搜索策略会花费我更长的时间。如果有人还在阅读这篇文章,请使用全文索引来测试您的想法,然后在您知道适用于您的域的策略后转移到 lucene。
于 2010-03-27T20:31:15.500 回答
0
就像在
在哪里解释(如何做)。但是,想出合适的方法是很困难的。
于 2010-03-22T12:51:39.257 回答