我正在做基于代理的建模,目前在 Python 中进行了设置,但如有必要,我可以切换到 Java。
我在 Twitter 上有一个数据集(1100 万个节点和 8500 万个有向边),并且我已经设置了一个字典/哈希图,以便键是特定用户 A,它的值是所有关注者的列表(关注用户的人一个)。“节点”实际上只是整数 ID 号(唯一),没有其他数据。我希望能够通过某种聚类方法来可视化这些数据。并非所有单个节点都必须被可视化,但我希望拥有最多 n 个关注者的节点能够被清晰地可视化,并且该节点周围的区域将代表所有关注它的人。我正在对整个地图的分布进行建模,因此我需要节点和节点周围的区域来更改颜色。理想情况下,这将是一个连续的可视化,但我不介意它只是在每次迭代时拍摄快照。
此外,我正在考虑将集群分开,这样:
如果 A 和 B 有足够的追随者可以单独可视化,并且 A 和 B 是连接的(一个跟随另一个,或者甚至是两个方向),那么它们是两者都是可视化的,但尽管被连接,但在视觉上彼此分离,因此可视化更清晰。
无论如何,我想知道 Python(最好)或 Java 中是否有一个包可以让人们轻松地完成这个工作。