通常,仅使用实值向量实现 Kohonen 映射/SOM 算法是一项相对简单的任务。由于“权重更新”阶段,我想知道如何为文本字符串等非实值(即非标量)属性实现这种算法。
假设有一组数据包含不同长度、含义类别以及浪漫程度的单词,例如rose(非常浪漫)、flower(浪漫)、plant(浪漫取决于上下文)、factory(仅浪漫)蒸汽朋克)。我在编造,所以请忽略细节。(编辑:是的,浪漫性可以表示为一个标量值;我的问题实际上与那部分无关。)
可以打乱单词甚至字母以在地图上创建原型,然后使用 Levenshtein 距离来找到最佳匹配单元,我明白了。但是如何将BMU 及其邻域更新为选定的目标向量?
其他示例可能是嵌入一维(标量)数据流中的绘画(例如,按颜色、主题、时代……)或感知形状(例如三角形、锯齿……)。