我是机器学习的新手,想在 MATLAB 中实现依赖于距离的中餐厅流程,以对音轨进行聚类。
我希望在 26 个功能上使用 dd-CRP。我猜这个过程可能是这样的
- 读入第一个特征向量并为其分配一个“表格”
- 读入第二个特征向量并将其与第一个“表”进行比较,可能使用两个向量的余弦角(由于高维),如果它在某个定义的 theta 内一致,则加入该表,否则开始一个新表。
- 读入下一个特征并对每个现有表的新特征向量重复步骤 2。
- 在发生这种情况时,我将跟踪有多少表。
我将在例如 16 个音轨上运行算法。将音频输入算法的方式是第一个特征向量来自音轨 1 的第一帧,第二个特征向量来自音轨 2 中的第一帧等,因为我试图找出哪个音轨最喜欢聚集在一起,但我不想定义有多少个质心。显然,我必须跟踪哪个音轨在哪个“桌子”上。
这有意义吗?