我有一个有向图(实际上它是一个超图,但暂时可以忽略它)。
从这个图中,我选择了各种子图,并且我正在寻找一个函数,它可以根据它们的“集群质量”对各种此类子集进行排名。
当子集的成员之间存在大量链接时,“集群质量”应该很高
当从子集的许多成员到子集或从子集外部存在大量链接时,“集群质量”应该很低。
我的问题是:
“集群质量”的正确术语是什么?
在这种情况下确实存在哪些相关算法/功能?
JVM 上存在哪些实现。首选 Scala,但任何可从 java 调用的东西都可以吗?
背景:这个想法是从源代码(类和方法名称或其片段)中提取单词,并通过查找“良好集群”使用的单词,从而找到那些可能最好地描述应用程序的单词,从而可能代表代码中的一些知识概念。