1

是否有我试图在下面描述的模式/算法的名称?...

假设您有一个相关数据树,如下所示:

  • IDE
    • 视觉工作室
      • 视觉工作室 2008
      • 视觉工作室 2010

然后我有一个对象,其中包含对“Visual Studio 2010”的引用。

然后我在这个对象上对“Visual Studio”进行相关性搜索,并想知道这个匹配的相关性。

在通过单独设置节点之间的特定值来构建树时,这是最好的做法吗?或者我可以/应该设置吗,例如,一层距离为 10 点,两层距离为 5 点,依此类推?

多个节点可能会链接到多个其他节点。或者这是一个坏主意?Visual Studio 也是一个“微软软件”等等。

这也可以做成两种方式吗?树上和树下都有点。

这是我测试和构建某种相关引擎的最初想法。请帮助我让我走上某种轨道。

4

1 回答 1

4

这是一大罐蠕虫,如果这是手波和一般的,请原谅我。您可以在此数据结构中构建各种关系。目前,您有一个关系分类。您还提到了另一类“Microsoft 软件”,它将跨越您的分类。然后你可以进入有关系等等。

更一般地说,你在谈论一个本体。虽然有大量关于如何构建和搜索它们的研究,但我不知道有任何大型项目以编程方式构建了丰富的本体,即使您让专家手动构建本体,也并不总是很清楚如何为“相关引擎”加权。我不在这方面的前沿,但大多数最有效的信息检索技术是在简单结构上运行的统计技术,而不是具有丰富结构化数据模型的技术。

I think you're on the right track. My advice - keep it as simple as possible. I would structure the hierarchy as a general graph and base relevance on graph distance, if necessary putting a weight on each edge. Bidirectionality is good here too, so you can penalize for generalization/specification as necessary. There's no real cookbook approach here, you'll have to experiment

于 2011-05-26T18:49:47.287 回答