在用于 MICROARRAY DATA 的数据挖掘软件 WEKA 中,如何从现有数据集中删除冗余元组?删除冗余的代码应该在 JAVA 中。
即,数据集包含诸如
H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
这里的元组 1,4,5 是多余的。
代码应返回以下 REDUNDANCY REMOVED 数据集...
H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0