neural-network - 在使用 TensorFlow 训练 MNIST 后，我们如何识别真实图像上的文本？

Question

我刚刚运行了代码来训练 MNIST 模型。我们如何应用它来识别真实图像中的笔迹？我是新手，刚刚开始学习这部分。我已经搜索并找不到有关此的信息。

score 3 · Accepted Answer

这取决于您的具体任务。MNIST 模型可以对字符数字进行分类，因此这是您需要提供的数据。

如果您坚持使用 MNIST 模型（RNN 特别是LSTM是大多数 OCR 使用的更好选择。）一种方法是在您的手写文本图像上运行一个滑动窗口并创建一个由模型预测的字符的文本文件. 但这也带来了一系列挑战，例如新奇检测和滑动窗口大小。这是一个矫枉过正

score 1 · Accepted Answer

神经网络本质上非常擅长识别你喂给它的“东西”。对于 MNIST 示例，您为其提供了大量 28x28x1 的手写数字图像。

因此，作为扩展，如果您想使用完全相同的模型进行手写（我假设您现在是指来自 AZ 的字符），那么您将必须为其提供大量 28x28x1 的手写字符图像。

score 0 · Accepted Answer

您必须考虑到 MNIST 数据集在很大程度上是一个“玩具数据集”，它只是“Hello world！” 图像识别，因此，它对于现实生活中的问题不是很有用。如果你重新创建训练图像条件并尝试预测，你会得到很好的结果，但同样，这不是现实生活中的问题，但也许这是一个有趣的项目。

话虽如此，也许您还不熟悉特征提取，这是现代卷积神经网络使用的一种技术。使用它也许你可以从 MNIST 训练的模型中得到一些有用的东西。从这个意义上说， Tensorflow 的 CNN 教程会很有帮助。为了进一步理解这项技术，我强烈推荐Michael Nielsen 的深度学习在线书籍的第 6 章

希望能帮助到你

3 回答 3