我打算使用橙色进行 kmeans 聚类。我已经阅读了教程,但我仍然有几个问题想问:
我正在处理高维向量上的聚类。1)是否实施了余弦距离?2)我不想给空值零。我尝试在空字段中没有任何零并且收到错误:
SystemError: 'orange.TabDelimExampleGenerator': the number of attribute types does not match the number of attributes
如何指示空值?3) 有没有办法将“ID”合并到示例表中?我想通过 ID(非分类)标记我的数据,以便于参考。我不将 ID 列作为我数据的正式部分。
4) 有没有办法为 kmeans 聚类提供不同的输出?我更喜欢这种格式的东西:
cluster1: [ <id1>, <id2>, ...]
cluster2: [ <id3>, ... ]
rather than just [1, 2, 3,1 , 2, ... ]
谢谢!