0

我有一个庞大的数据集,该数据集包含超过 10,000 个向量,每个向量现在是 252 维,在我继续之前,因为我不是来自机器学习或数学领域。我有一些问题要问:

1.我想减少每个向量的维度,但我不知道选择哪种算法。

2. KD-Tree 是不是一个不错的选择?

4

1 回答 1

0
  1. 来吧,尝试不同的降维技术。没有一般最好的,你需要尝试一些东西。

  2. Kd-tree 通常不适用于 252 维。因为它是为欧几里得和曼哈顿距离设计的,而这些在 252 维中并没有太大意义。

但是只有 10000 个实例,您可能根本不需要索引。那是微小的。10000 * 252 * 8 字节 = 20 MB,这不是很多。它很容易装入主存储器。

于 2013-04-27T18:19:53.837 回答