我已经给出了不同功能的记录。我总共有 8 个功能。有些是二进制的,但有些的值范围是 0 到 1000 万。我的大目标是对数据进行聚类。目前,我仍在为这些数据寻找合适的距离度量。
我知道欧几里得距离是最常见的距离度量。我已经尝试过了,并将它的非二进制数据标准化到 0 到 1 之间的范围内。是否有另一种距离度量可能更适合该数据?
我已经给出了不同功能的记录。我总共有 8 个功能。有些是二进制的,但有些的值范围是 0 到 1000 万。我的大目标是对数据进行聚类。目前,我仍在为这些数据寻找合适的距离度量。
我知道欧几里得距离是最常见的距离度量。我已经尝试过了,并将它的非二进制数据标准化到 0 到 1 之间的范围内。是否有另一种距离度量可能更适合该数据?