如何测量一个特征向量的不同数量实例之间的可分性?例如主向量为 V=[1 1 2 3 4 5 7 8 10 100 1000 99 999 54],不同样本长度的不同组合为 t1=[1 1 2 3 99 1000] 或 t2=[1 10 1000]或 t3=[2 3 4 10 100 99 999 54] 哪一个更可分离且信息更丰富?如果我把它放在 GMM 中,样本较少的向量具有更好的概率,这是不公平的。
train=[1 2 1 2 1 2 100 101 102 99 100 101 1000 1001 999 1003];
No_of_Iterations=10;
No_of_Clusters=3;
[mm,vv,ww]=gaussmix(train,[],No_of_Iterations,No_of_Clusters);
test1=[1 1 1 2 2 2 100 100 100 101 1000 1000 1000];
test2=[1 1 2 2 100 99 1000 999];
test3=[1 100 1000];
[lp,rp,kh,kp]=gaussmixp(test1,mm,vv,ww);
sum(lp)
[lp,rp,kh,kp]=gaussmixp(test2,mm,vv,ww);
sum(lp)
[lp,rp,kh,kp]=gaussmixp(test3,mm,vv,ww);
sum(lp)
结果如下:
答案=
-8.0912e+05
答案=
-8.1782e+05
答案=
-5.0381e+05
如果您能帮助我,我将不胜感激。