我正在尝试绘制网站的链接结构,以便我可以模拟给定域上的页面如何相互链接。注意我没有绘制指向不在根域上的站点的链接。
显然,该图的大小可能相当大。我想要执行的主要查询之一是计算有多少页面直接链接到给定的 url。我想对整个图表(不寒而栗)运行它,这样我最终得到一个 url 列表和指向该 url 的传入链接的计数。
我知道一种流行的方法是通过某种地图减少 - 我可能最终还是会这样做 - 但是我需要能够(接近)实时查看此报告,这通常不是地图减少友好。
我已经快速浏览了 neo4j 和 OrientDb。虽然这两个都可以模拟我想要的关系,但我不清楚我是否可以查询它们来生成我想要的报告。在这一点上,我不致力于任何特别的技术。
任何帮助将不胜感激。谢谢,保罗