我正在构建一个 K-最近邻分类器,我想一次完成所有距离计算(这也会有所帮助,因为未矢量化的版本需要很长时间才能运行)。
我有一个大小为 28000 个示例 x 784 个特征的测试数据集,我有一个大小为 42000 个示例 x 784 个特征的训练数据集。回答我的问题的代码应该生成一个大小为 28000 x 42000 的矩阵,其中每一行都包含从该测试示例到每个 42000 个训练示例的距离。
我想出的最好方法是使用 sum 和 bsxfun 一次计算每个测试示例的所有距离,但我仍然需要遍历所有 28000 个示例,而且正如我之前所说,这需要一段时间。