我有想要使用 Weka 进行聚类的高维(200 维)向量。我应该如何以 ARFF 格式表示它?
数据是这样的(dim1、dim2 等是实数):
矢量标签 dim1 dim2 dim3 ...... dim200
此处的链接 - http://weka.wikispaces.com/ARFF+%28stable+version%29告诉我,我应该将其表示如下:
@RELATION vectors
@ATTRIBUTE vector_label STRING
@ATTRIBUTE dim1 NUMERIC
@ATTRIBUTE dim2 NUMERIC
@ATTRIBUTE dim3 NUMERIC
....
@ATTRIBUTE dim200 NUMERIC
@DATA
vector1,0.1,0.2,-2.1, ...... ,-0.1
等等。
这个对吗?我问的原因是链接并没有真正清楚地说明关于高维向量的任何内容,但我觉得可能有更好的方式来表示它们,我不知道。