1

我对神经网络有基本的了解。我知道应该有存储 0 或 1 对应于不同类别标签的 ay 矩阵(预期结果)。例如,对于数字识别,如果要识别的数字是 6,那么 y 向量应该是[0,0,0,0,0,1,0,0,0,0]。但是,当我在 Github 上的 MXNet.jl 存储库中看到 MXNet 示例时,我无法识别任何准备这种结果矩阵的代码。我认为神奇在于get_mnist_providers()返回 2 个提供者的方法:

train_provider, eval_provider = get_mnist_providers(batch_size)

我不知道这些提供者是什么——train_provider、eval_provider。请帮助我了解这些提供商。我正在尝试编写具有不同分类的算法,因此了解该提供程序至关重要。

4

1 回答 1

1

您提供与标签对应的 y 向量是正确的。在 MXNet 中有迭代器的概念。迭代器用于将数据绑定到标签。您的 get_mnist_providers 方法可能正在做的是提供附加了相应标签的数据迭代器。

要更详细地了解数据迭代器如何融入模型优化的整体画面,您可以尝试本教程(链接到mxnet-notebooks Github 存储库): linear-regression.ipynb

(您将需要 jupyter notebook 来运行教程。只需 pip install jupyter 然后在教程文件所在的文件夹中运行命令“jupyter notebook”)

于 2017-02-01T20:56:56.113 回答