问题标签 [pagerank]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
4722 浏览

python - Textrank:使用networkx补充pagerank以进行句子提取

我正在尝试实现用于句子提取的 textrank 算法,如此处所述。为此,需要用加权边来补充 pagerank 算法并让它在无向图上运行。Networkx pagerank 算法实现允许我轻松集成加权边,据说可以将有向图转换为无向图:请参见此处。但是,当我测试时,它似乎仍然使用有向图。我在这里想念什么?帮助很大。

例子:


输出:{'A':0.25974025929223499,'C':0.40692640737443164,'B':0.33333333333333331}

0 投票
1 回答
60 浏览

optimization - 搜索引擎结果中的页面排名

我有一个问题需要回答...

我已经建立了一个网站,现在我需要根据我拥有的一些关键字将它显示在搜索结果的第一页上的谷歌、雅虎和其他网站上...

我想知道如何实现这一目标。我需要更改代码吗?.ht 访问?

谢谢大家。

0 投票
1 回答
2796 浏览

python - 使用 NetworkX 计算 2 个节点之间的命中时间

我想知道我是否可以NetworkX用来实现击球时间?基本上我想计算图表中任意 2 个节点之间的命中时间。我的图表是未加权且无向的。如果我正确理解点击时间,它与 PageRank 的想法非常相似。

知道如何使用 NetworkX 提供的 PageRank 方法实现点击时间吗?

我可以知道是否有任何好的起点可以使用?

我检查过:MapReduce、Python 和 NetworkX ,但不太确定它是如何工作的。

0 投票
1 回答
3191 浏览

jung - 如何在 JUNG 中使用 PageRank 算法?

我使用 JUNG 作为我的工具来可视化网络图和计算网络属性(例如:入度、出度和页面排名)。

我知道 JUNG 已经实现了 PageRank 算法,但是手册中没有关于使用 pagerank 算法的说明(http://jung.sourceforge.net/doc/index.html)。

有谁知道该怎么做?

我也尝试了以下代码,但出现错误“ Vertex CLP Holdings Ltd not an element of this graph ”。

代码文件在这里

谢谢!!

0 投票
1 回答
313 浏览

hadoop - 对 Pagerank 执行的质疑

我正在尝试执行以下代码: http: //blog.xebia.com/2011/09/27/wiki-pagerank-with-hadoop/

javac 没有显示错误,但我不知道如何获取输出?这些是我正在遵循的执行步骤:

这是正确的吗?我严重怀疑最后一步——输入和输出路径!!在代码中,他们使用了 wiki/in,这就是为什么我在这里给出了相同的路径,并且我已经将我的示例数据集复制到了这个路径。地图减少过程开始,但我没有得到任何输出!

0 投票
2 回答
1135 浏览

java - 如何实时计算页面排名

我已阅读http://en.wikipedia.org/wiki/PageRank中的解释,并且我了解页面排名是通过传入链接和传出链接计算的。

我在爬取网页并存储在数据库中时有一个爬虫,我需要一个页面排名算法。我有一个具有以下值的数据库

你能解释一下我需要任何其他值来计算页面排名吗?请解释如何使用java计算它

0 投票
1 回答
981 浏览

jung - 谁能告诉我如何为 JUNG 创建页面排名图表

我只是想为我的小型网络实现页面排名,我从这些问题中得到了一些答案。

JUNG 是一个实现 pagerank 的网络图库。但我还没有看到任何如何计算图表的例子。任何人都可以用一个例子来解释它。

0 投票
1 回答
416 浏览

php - 使用 seo 友好的 url 提高 pagerank

这是我在 stackoverflow 上的第一篇文章。我想在我的网站上提高它的 google pagerank,我只是发现有几十个东西用来给网页提供 pagerank,其中一个是 seo 友好的 url。

我的网站是用 php 开发的,我想知道如何实现对 seo 友好的 url,以及我必须在我的 .htaccess 文件中对其进行哪些更改。而且,还有没有其他好的机制来提高pagerank。

提前致谢。

0 投票
1 回答
868 浏览

graph - 是否可以在没有整个数据集的情况下进行 pagerank?

对不起,如果这很愚蠢,但我只是想我应该试一试。假设我有一个巨大的图表(例如,1000 亿个节点)。Neo4J 支持 320 亿,其他支持或多或少相同,所以说我不能同时在数据库中拥有整个数据集,如果它是有向图(无循环)并且每组节点连接,我可以在其上运行 pagerank到下一组节点(因此不会向后创建新链接,只会创建指向新数据集的新链接)。

有没有一种方法可以以某种方式获取以前的 pagerank 分数并将它们应用于新的数据集(我只关心最近一组数据的 pagerank,但需要前一组的 pagerank 来导出最后一组数据)?

那有意义吗?如果可以,有可能吗?

0 投票
1 回答
1215 浏览

java - pagerank:如何解决 java.lang.StackOverflowError?

我正在尝试实现一个以 100 万个节点作为输入的 pagerank 算法。

但是,我有这个错误。我很确定这是因为来自 generateParamList() 的开放递归调用问题。

我试图以一种不同的方式使这种方法不使用递归,但一次又一次地失败。如果您让我知道如何修改“generateParamList()”,我将不胜感激!!!

输入格式:1 126645 320349 144068 635538​​ 37354 141327 53842 121180 4786 31658 285466 526963 93938 9097 32341 ...... 2 ......