0

我正在构建一个 K-最近邻分类器,我想一次完成所有距离计算(这也会有所帮助,因为未矢量化的版本需要很长时间才能运行)。

我有一个大小为 28000 个示例 x 784 个特征的测试数据集,我有一个大小为 42000 个示例 x 784 个特征的训练数据集。回答我的问题的代码应该生成一个大小为 28000 x 42000 的矩阵,其中每一行都包含从该测试示例到每个 42000 个训练示例的距离。

我想出的最好方法是使用 sum 和 bsxfun 一次计算每个测试示例的所有距离,但我仍然需要遍历所有 28000 个示例,而且正如我之前所说,这需要一段时间。

4

1 回答 1

2

pdist2(A, B)将准确地完成您的需求,您的训练和测试数据集分别在哪里A和在哪里。B这是参考: http: //www.mathworks.com/help/stats/pdist2.html

于 2013-01-08T00:46:37.057 回答