algorithm - 相关性/匹配值树的算法

Question

是否有我试图在下面描述的模式/算法的名称？...

假设您有一个相关数据树，如下所示：

IDE

视觉工作室

视觉工作室 2008

视觉工作室 2010

蚀

然后我有一个对象，其中包含对“Visual Studio 2010”的引用。

然后我在这个对象上对“Visual Studio”进行相关性搜索，并想知道这个匹配的相关性。

在通过单独设置节点之间的特定值来构建树时，这是最好的做法吗？或者我可以/应该设置吗，例如，一层距离为 10 点，两层距离为 5 点，依此类推？

多个节点可能会链接到多个其他节点。或者这是一个坏主意？Visual Studio 也是一个“微软软件”等等。

这也可以做成两种方式吗？树上和树下都有点。

这是我测试和构建某种相关引擎的最初想法。请帮助我让我走上某种轨道。

score 4 · Accepted Answer

这是一大罐蠕虫，如果这是手波和一般的，请原谅我。您可以在此数据结构中构建各种关系。目前，您有一个关系分类。您还提到了另一类“Microsoft 软件”，它将跨越您的分类。然后你可以进入有关系等等。

更一般地说，你在谈论一个本体。虽然有大量关于如何构建和搜索它们的研究，但我不知道有任何大型项目以编程方式构建了丰富的本体，即使您让专家手动构建本体，也并不总是很清楚如何为“相关引擎”加权。我不在这方面的前沿，但大多数最有效的信息检索技术是在简单结构上运行的统计技术，而不是具有丰富结构化数据模型的技术。

I think you're on the right track. My advice - keep it as simple as possible. I would structure the hierarchy as a general graph and base relevance on graph distance, if necessary putting a weight on each edge. Bidirectionality is good here too, so you can penalize for generalization/specification as necessary. There's no real cookbook approach here, you'll have to experiment

algorithm - 相关性/匹配值树的算法

1 回答 1

Related

Reference