问题标签 [mnist]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
30678 浏览

python - 如何以“mnist.pkl.gz”中使用的确切格式和数据结构将我的数据集放入 .pkl 文件中?

我正在尝试使用 Python 中的 Theano 库对 Deep Belief Networks 进行一些实验。我使用这个地址中的代码:DBN full code。此代码使用MNIST 手写数据库。这个文件已经是pickle格式了。它未选中:

  • 动车组
  • 有效集
  • 测试集

在以下内容中进一步未腌制:

  • train_set_x, train_set_y = train_set
  • 有效集合 x,有效集合 y = 有​​效集合
  • test_set_x, test_set_y = test_set

请问有人可以给我构造这个数据集的代码以便创建我自己的吗?我使用的 DBN 示例需要这种格式的数据,我不知道该怎么做。如果有人对如何解决此问题有任何想法,请告诉我。

这是我的代码:

0 投票
1 回答
604 浏览

classification - MNIST 数据集上的 NuPIC

我是新手。我认为 NuPIC 的想法真的很酷,因此想在 NuPIC 的输出上应用 KNN 分类器。我看到 python 中已经有一个 KNNClassifier 对象。我对应该使用的输入模式感到困惑。在 MNIST 数据集的情况下,我将拥有图像,其中每个图像都是一个 2D 数字数组并且将是稀疏的。我可以理解输出的格式可以使用 NuPIC 中的分类编码器进行编码,但是没有这样的例子来编码以数组形式出现的输入。

任何帮助将不胜感激。

0 投票
1 回答
3150 浏览

java - 如何创建像 MNIST 数据集这样的文件

所以我有一堆图像(PNG),它们的名字可以用作标签。是否有工具或示例说明我如何获取这些图像并创建像 MNIST IDX 一样的数据集。

有很多关于如何阅读它们的示例,但没有关于如何创建它们的示例。

任何帮助将不胜感激!

0 投票
1 回答
305 浏览

r - R:打开mnist标签文件

最近我在做一个与图像识别相关的项目。我正在尝试使用 MNIST 数据集。我已经在如何打开数据集的图像文件(使用 readBin)方面获得了一些帮助,但被困在如何打开标签文件上。我用了

获得连接,但我不知道下一步该做什么。感谢您的帮助!

0 投票
3 回答
11372 浏览

python - 使用 MNIST 数据集训练的 NN 和 CNN 数字识别前的预处理

我正在尝试通过使用 NN 和 CNN 对自己和几个朋友编写的手写数字进行分类。为了训练 NN,使用了 MNIST 数据集。问题是使用 MNIST 数据集训练的 NN 在我的数据集上没有给出令人满意的测试结果。我在 Python 和 MATLAB 上使用了一些具有不同设置的库,如下所示。

在 Python 上,我使用此代码进行设置;

  • 3 层神经网络,输入数 = 784,隐藏神经元数 = 30,输出数 = 10
  • 成本函数 = 交叉熵
  • 时期数 = 30
  • 批量大小 = 10
  • 学习率 = 0.5

用MNIST训练集训练,测试结果如下:

MNIST 上的测试结果 = 96% 我自己的数据集上的测试结果 = 80%

在 MATLAB 上,我使用了具有各种设置的深度学习工具箱,包括归一化,与上述类似,NN 的最佳精度约为 75%。在 MATLAB 上使用了 NN 和 CNN。

我试图将我自己的数据集与 MNIST 相似。以上结果从预处理数据集中收集。这是应用于我的数据集的预处理:

  • 每个数字被单独裁剪并通过使用双三次插值调整为 28 x 28
  • 通过在 MATLAB 上使用边界框,路径以 MNIST 中的平均值为中心
  • 背景为 0,最高像素值为 1,如 MNIST

我不知道该怎么做更多。对比度等仍然存在一些差异,但对比度增强试验无法提高准确性。

这是来自 MNIST 和我自己的数据集的一些数字,用于直观地比较它们。

MNIST 数字

我自己的数据集

如您所见,存在明显的对比度差异。我认为准确性问题是因为 MNIST 和我自己的数据集之间缺乏相似性。我该如何处理这个问题?

这里有一个类似的问题,但他的数据集是打印数字的集合,不像我的。

编辑:我还在使用二值化 MNIST 和默认 MNIST 训练的 NN 上测试了我自己的数据集的二值化版本。二值化阈值为 0.05。

这是分别来自 MNIST 数据集和我自己的数据集的矩阵形式的示例图像。两人都是5。

MNIST:

我自己的数据集:

0 投票
0 回答
309 浏览

c# - SOMLearning() & GetWinner() function in AFroge.Net (Neural Nerworks)

I'm trying to train a DistanceNetwork with SOMLearning of MNIST DB (of handwritten digits).

Each image represented as a 28*28 pixels vector (784 cells), and a label of 0-9.

This is the initialization code:

And this is the training cycle basic code:

After the iterations are finished, when I'm trying to Compute images from the Training Set (for a sanity check), I don't get the nearest image (as I think its suppose to be).

For example, in this test:

I'm trying to get the same image vector that was inserted to the network, so nearestImage suppose to be the same image as the computed image. but I can't find a way to get the nearest image, just the winner neuron (with GetWinner() >> The method returns index of the neuron, which weights have the minimum distance from network's input. )

this is an example of the outputs for some 3 imputs from the training set:

enter image description here

enter image description here

enter image description here

So because the output image I got from the weights is not accurate, I can't get the label of the output image,

also I didn't find a way to insert the label to the train method, but it can be done by putting the label at the first index of the vector).

Please help me to figure out how to make it work, there is not much info out there.

References:

http://www.aforgenet.com/framework/docs/html/ec926d74-a319-191e-edbe-ee5d9321f304.htm http://www.aforgenet.com/framework/samples/neuro_som.html

0 投票
1 回答
474 浏览

lua - 带有数据预处理的neuralnetwork_turial.lua 问题

我先安装了torch深度学习模块git clone然后使用luarocks make,安装很成功。在require 'dp'火炬提示中效果很好。

但是当我尝试执行neuralnetwork_tutorial.lua ( th neuralnetwork_tutorial.lua) 时,它会抛出以下错误。

print在这些脚本中添加了一些语句来理解流程。我碰巧注意到在File.lua中获取对象后的第一步是确定对象的类型;其中8个已​​被宣布。类型已通过 0 到 7 声明,0 为TYPE_NIL. 但是代码失败了,因为它检测到类型 28(??)。

请问我哪里出错了?或者去哪里寻找问题?

PS:脚本自行下载数据,但由于某些标准企业代理设置问题,无法下载。因此,我亲自下载了数据MNIST,并将其存储在特定的数据目录中。如果这可能是一个线索?

0 投票
1 回答
4966 浏览

machine-learning - 如何将 .txt 转换为 .idx3-ubyte 格式?

我正在做一个基于卷积神经网络的项目,我正在使用 MNisT 数据库作为训练图像和测试数据。我想为 Kannada Digits 执行此操作,但我用于数据集的格式是 .txt,而我只采用 idx3-ubyte 格式的基本代码。请向我推荐任何可以将 .txt 文件转换为 .idx3-ubyte 的工具。

0 投票
1 回答
1665 浏览

r - 系统错误(cmd,输入 = 文件列表,实习生 = TRUE):找不到“zip”

我尝试使用包darch和函数读取 MNIST 数据库readMNIST() 它似乎工作正常,直到我收到消息:

系统错误(cmd,输入 = 文件列表,实习生 = TRUE):'zip' not found'

我在网上查了一下,发现那是因为我使用的是 Windows,它需要在路径中添加一个 zip 软件:R_ZIPCMD. 于是上网RTools找了找,用包下载安装了,看起来很合适的软件installr。R 找到它,但是当我输入时 PATH 保持不变:

Sys.getenv("R_ZIPCMD")

我仍然得到"" 它似乎我必须手动完成,有人可以帮我完成这个,因为我对所有这些深度操作感到不知所措!

0 投票
1 回答
18477 浏览

python - Python Numpy 错误:ValueError:使用序列设置数组元素

我正在尝试构建一个类似于 theanologistic_sgd.py 实现中提供的 mnist.pkl.gz 的数据集。以下是我的代码片段。

错误消息:回溯(最后一次调用):


csv文件包含两个字段..图像名称,分类标签在python解释器中运行时,它似乎对我有用..如下..我没有得到错误说在这里设置一个带有序列的数组元素..

---------python解释器输出----------

即使我正在运行相同的指令集(逻辑上),当我运行 sample.py 时,我得到 valueError: setting an array element with a sequence..我试图理解这种行为..任何帮助都会很棒..