我还在研究评估使用聚类(无监督学习)形成的聚类吗?
我试过谷歌搜索,但我得到的措施太理论化了。如果人们可以分享他们用来评估所形成集群的机制,那就太好了。假设我有一个 Java 集群,它将包含 Java EE、Java ME、RMI、JVM 等,另一个集群说 NoSQL,它将有 Neo4j、OrientDB、CouchDB 等。这是完美的,我的集群算法给了我最多准确的集群。
然而,在训练和测试之后,我可能会在 NoSQL 集群下说 MySQL、Oracle,所以我只是做一个手动/视觉解释,然后重新训练我的算法或调整它,以便我获得更好的集群。
现在我想自动化这个手动可视化集群的过程,并拥有一个系统,可以让我获得形成的集群的准确性。我正在寻找与搜索中使用的 Precision、Recall、NDCG、Map 等类似的东西。我的集群长度不同,并且可以形成 n 个不同的集群,因此精度/召回率不是正确的。