1

我认为我现在这样做效率低下,并且想要一个关于如何更好地做到这一点的建议。目前我有一个有向图并且正在使用节点特定因素(即分析节点,然后将分数分配给两者之间的边)。我有很多因素并不断改变边缘的权重(在我的情况下,权重越高越好)。

但这些都是特定于节点的,我还想利用图的结构来进行推断(更多的边应该给节点一个更好的排名,等等)。

我的问题是这是两个正在发生的不同过程,我想看看我是否可以以某种方式将两者结合在一起进行推断。现在,我在我的节点上运行 pagerank(每组节点都是我的日子,所以我在整个数据集上运行 pagerank 然后只捕获当天的结果),然后获取当天的 pagerank 分数并将它们添加到从各个边到节点的所有权重的总和。它有点令人困惑,我想知道是否有另一种方法,或者我是否可以让 pagerank 考虑边缘权重(或其他东西......我可以轻松修改程序)?

我对当前方法的恐惧是,当我为每个节点添加更多因素来研究时,分数会增加(每个节点添加一个介于 0-1 之间的值)但 pagerank 分数保持很小,所以如果 aa 节点的分数为 25 和pagerank 为 0.034,那么相对而言,pagerank 分数在图上的推理中不会起到很大的作用。

任何帮助或建议都会很棒。我已经阅读了一些图表,但我仍然是一个 n00b,所以请纠正我所做的任何不正确的假设。另外,如果有帮助,我正在为我的图表使用 python 和 networkx 库。

4

1 回答 1

2

如果您主要关心的是节点分数和页面排名之间的相对权重,您就不能改变它们的权重以获得适当的平衡吗?例如,如果您使用平均值,而不是将分数的因素相加,那么因素的数量将不是问题。

于 2012-01-25T21:01:46.633 回答