我有以下问题:
我有一个表示为顶点 v0、v1、...、vN 的网页列表。
我有图表 g0、g1、...、gM,它们有边缘列表,显示用户在访问网站期间访问的页面,例如:
- g0: (v3, v44) ; (v44, v5)
- g1: (v3, v44) ; (v44, v5) ; (v5, v7)
- ...
- GM:...
我希望使用这些数据来开发网页访问模式集群。
我正在寻找: 1. 可以帮助我解决这个问题的算法的论文、博客等。2.开源代码,解决这个问题的代码片段。
提前致谢。
笔记:
我知道并使用图聚类算法。我正在寻找特定于这个应用程序的东西。