问题标签 [handwriting-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 运行 TensorFlow 模型训练代码时系统死机
我正在尝试训练手写数字的模型。我的数据由图像组成,每个大小为 80X80。所以我得到了 6400 个特征作为输入。在尝试按照https://www.kaggle.com/kakauandme/digit-recognizer/tensorflow-deep-nn中使用的代码训练模型时,我的系统在 200 次迭代后挂起,训练精度为 0.06。
为什么会这样?我没有收到任何错误。我的系统只是冻结。另外,如何设置池化层和卷积层参数?问题与这些参数有关吗?
PS:我没有使用GPU。
android - 安卓多字符手写手势识别
我已经为单个字符实现了用于 android 字符识别的手写手势,如下所示。
但我想一次读取多个字符,即Android。我可以通过以下实现读取单个字符。但是,我需要帮助才能同时识别像Android这样的完整单词。
到目前为止,我的实现如下所示。手势库mL库;
在提出我的问题之前,我希望那里的每个人都知道我已经检查并阅读了 stackoverflow 上关于这个问题的所有问题和答案。
android - 将 Google 手写输入键盘直接集成到您的 Android 应用中
我正在开发一个 android 应用程序,它可以在屏幕上获取用户笔迹并将其作为文本写入 android 的 editText 字段中。我以前使用过手势识别,但这并没有像我在其他一些帖子中讨论的那样走得太远。但是那个帖子在这里没有很好地回答我。
所以现在,我想使用谷歌手写输入作为我的书写键盘,而无需手动安装他们的键盘。简而言之,我所需要的只是将谷歌的手写输入键盘附加到我的应用程序上,并在用户将我的应用程序安装在 android 设备上时使用它。有什么解决办法吗?
machine-learning - 调整用于(离线)手写识别的神经网络的超参数
我目前正在使用 java 库对离线手写识别进行一些幼稚的实验。我给我的程序一个预先写好的英文句子的图像,并将其分割成单个字符,然后我将其馈送到一个非常天真的构建的神经网络。
我是神经网络的新手,所以我的问题是从哪里开始优化这个网络的超参数。目前它是一个简单的前馈网络,我使用弹性传播进行训练,所以我可以优化的唯一参数是隐藏层的数量,以及每个隐藏层中的神经元数量。我当然可以通过大量但有限数量的组合进行详尽的搜索,但这将非常耗时,而且我敢肯定,在这门艺术方面更有见识的人必须能够指出我的正确方向方向。
我在这里的某个地方发现了一篇文章,该文章指出,对于任何网络来说,一个好的起点通常是只使用一个隐藏层,其神经元数量等于输入和输出层中神经元的平均数量,所以我就是这样目前正在做。
我使用这个模型获得了大约 40-60%(取决于字符)的准确度。
c# - Windows.UI.Input.Inking.dll 可以与 Visual Studio 2015 社区桌面版一起使用吗?
我已经尝试了几个小时Windows.UI.Input.Inking.dll
在 Windows 10(64 位)上使用对的引用,但没有成功。
可以Windows.UI.Input.Inking.dll
与 Visual Studio 2015 社区、桌面版一起使用吗?
如果是这样,怎么做?
如果不能使用,Windows 10应该使用什么dll进行手写识别?
(我目前正在使用 Wacom 平板电脑将墨水收集到我的 Windows 10 台式电脑。我希望在 中玩手写识别WPF context
)。
无法添加对 C:\Windows\System32\Windows.UI.Input.Inking.dll 的引用。请确保该文件是可访问的,并且它是一个有效的程序集或 COM 组件。
TIA
fonts - 手写数字的训练 Tesseract:mftraining 步骤需要永远
我一直在尝试训练 Tesseract 3.04 来识别手写数字。该方法首先在以下链接中的论文中提出:https ://arxiv.org/abs/1003.5897 。我已经使用 Training Tesseract 3.04 wiki 页面和本教程执行了必要的步骤:http ://www.resolverradiologic.com/blog/2013/01/15/training-tesseract/
我从扫描的页面创建了一个 tiff 图像,其中包括我手写的数字。我可以使用用于 tesseract 的某个第三方 GUI(称为 tesseract4java)创建一个盒子文件并编辑该盒子文件。我已经进入 mftraining 步骤,没有明显问题。
但是在给出命令后:mftraining -F font_properties -U unicharset -O ali.unicharset ali.test_font.exp0.tr
训练步骤需要永远运行,并且在某些时候我的笔记本电脑会崩溃。由于我只训练了 10 个字符,每个字符最多有 15 个实例,我假设这种行为正在发生,因为我在上一步中犯了错误。以下是我对可能出错的想法:
我创建了一个 font_properties 文件,并在其中添加了一个具有所需格式的文本文件。但由于我同时也在创建一种新字体,可能 tesseract 无法识别新字体或认为我将这些字体混合在一个 tiff 图像中。那么我应该在我的字体属性文件中添加一个新的字体名称吗?但是手写数字应该有什么字体呢?
Training Tesseract 页面指出我应该将我的训练文本添加为 UTF-8 文本文件,但我还没有完成这一步。我没有训练文本,只有图像,我不知道如何将数字转换为 UTF-8 文本文件以及将该文件放在哪里。这会导致我遇到的问题吗?
也许我创建的文件在错误的目录中。目前我附加的所有文件(+unicharset 和 font_properties)都在 tesseract.304 目录中。我应该将它们添加到 tessdata 还是在 tesseract 目录中创建一个新文件?
任何回答这些问题的帮助或任何其他关于为什么我的 mftraining 步骤将永远进行的建议将不胜感激。非常感谢。
matlab - 在matlab中使用sobel掩码算子找到梯度
我正在使用以下代码使用 sobel mask 屏蔽图像。
我的问题是,有时梯度方向值是“NaN”,如何避免呢?
二、如何将梯度方向量化为8个区域并找到图像的特征向量?请有人帮助我。
android - 如何在我的 Android 应用程序中集成数字的手写输入?
我的设计团队建议用户可以通过将安卓键盘切换到手写模式来在表单字段中输入数字。例如,用户可以通过在键盘上书写来输入 7000。
如何在我的 android 应用程序中实现这一点?