我知道 Knn 有一个问题,知道在处理高维数据时会出现“维度诅咒”,其理由是它在计算距离时包含所有特征,即欧几里得距离,其中非重要特征充当噪声并偏向结果,但我不这样做'不明白一些事情
1)余弦距离度量将如何受到维度灾难的影响,即我们将余弦距离定义为 cosDistance = 1- cosSimilarity,其中 cosSimilarity 有利于高维数据,那么余弦距离如何受到维度灾难的影响?
2) 我们可以为 weka 中的特征分配任何权重,或者我可以将特征选择本地应用到 KNN 吗?本地到 knn 意味着我编写自己的 K-NN 类,在分类中我首先将训练实例转换为低维,然后计算测试实例邻居?