作为搜索引擎的一部分,我开发了一个倒排索引。
所以我有一个列表,其中包含以下类型的元素
public struct ForwardBarrelRecord
{
public string DocId;
public int hits { get; set; }
public List<int> hitLocation;
}
现在这个记录是针对一个词的。hitLocation 包含在文档中找到特定单词的位置。
现在我想要的是计算元素List<int> hitLocation
与另一个元素的接近程度List<int> hitLocation
,然后如果列表中的元素相邻,则增加两个记录的权重。
我遇到的问题是为此目的找到合适的算法。任何帮助表示赞赏