问题标签 [handwriting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3274 浏览

python - 从扫描图像中删除网格

我必须认出手工填写的银行表格的文本。表格有一个网格,如图所示。我是图像处理的新手。我读了几篇关于手写识别的论文,并将去噪、二值化作为预处理任务。我现在想分割图像并使用神经网络识别字符。为了分割我想摆脱网格的字符。

非常感谢您提前。 在此处输入图像描述

0 投票
0 回答
555 浏览

android - 手写软键盘 Android

我正在开发一个 android 键盘应用程序,它应该显示绘图画布而不是基于普通键的软键盘。就像Google 的手写键盘一样,我不想实现候选视图或进行手写识别。我的键盘只会获取画布中的文本并将其作为图像发送。

但是经过大量研究后,我仍然无法显示画布视图而不是键盘视图。我跟着:

https://code.tutsplus.com/tutorials/create-a-custom-keyboard-on-android--cms-22615

但这会增加一个带键盘的键盘视图。我不想有数字或字符键盘。我只想让键盘显示一个可以绘制的空画布,一旦完成,它应该发送该图像。

我也尝试过这样的布局:

然后尝试像这样加载它:

任何帮助或教程链接将不胜感激。

谢谢, 阿南德

0 投票
0 回答
228 浏览

tesseract - 我们可以在不使用神经网络的情况下进行笔迹检测和阅读吗?

我正在尝试从有笔迹的图像中提取文本。如果不是手写,我使用 tesseract 会得到很好的结果。

但是,我知道每个笔迹都有自己的特点,因此使用经过训练的模型来处理有限数量的笔迹将不足以获得良好的结果,因此我的问题是:

我们可以在不使用神经网络(机器学习)的情况下进行笔迹检测和阅读吗?

0 投票
0 回答
486 浏览

machine-learning - 哪种是检测文档中是否存在手写签名的正确方法?

我是机器学习的新手。我正在尝试找到一种方法来检测扫描文档中是否存在手写签名。经过大量研究,我发现使用 SVM 分类器是必不可少的。所以,当有机器学习的时候,就必须有训练阶段和训练数据集的需求。我碰巧从签名比赛中得到了一个数据集。所以现在,我是在我的图像上使用分段然后使用 svm 还是比以下更简单:我有 25 个文档,我将它们标记为已签名未签名?

0 投票
1 回答
264 浏览

azure - Azure Text 检测哪个是手写或 ocr

在 azure 中,他们有 2 个选项可以从手写或 OCR 图像中检测文本,但我没有得到置信度分数,所以我需要获得最好的一个文本结果,

什么引擎可以根据拼写或置信度得分处理哪个是最好的/相似的?

0 投票
1 回答
165 浏览

image - onenote API 手写图片叠加?

我使用C#调用OneNote API,遇到如下问题:提交图片和InkML数据后,图片会覆盖手写。没有办法自由指定图片和笔迹的重叠。这怎么可能实现。

在此处输入图像描述

这是我想要达到的效果:

在此处输入图像描述

0 投票
0 回答
121 浏览

deep-learning - 手写合成亚历克斯·格雷夫斯

我一直在尝试复制 alex Graves 手写合成模型,我使用 tensorflow 和 python 在带有 cuda 的 1080Ti GPU 上完成了这项工作,

我完全复制了论文中解释的所有特性,甚至将相应的梯度值剪裁到位,但我很难训练它。

我还按照论文中解释的方式对数据进行了预处理,包括对 X 和 y 偏移进行归一化,但问题是训练通常不能将负对数似然降低超过 1000,在论文中它达到 -1000,并且之后我看到了 NaN 权重。

我做的唯一额外的事情是在每个笔划的条件概率上添加 0.0000001,以防止对数似然中的 NaN 值。

有任何提示或建议或有关此类任务的经验吗?

这是我使用的单元格代码,

这是带有损失网络的 rnn:

编辑.1。我发现我以错误的方式剪裁渐变,正确的方法是引入一个新的“操作”,如https://github.com/tensorflow/tensorflow/issues/2793所解释的,仅剪裁整体的输出渐变网络和 lstm 单元。

将上面的行添加到您的代码中,并在您想要在反向传播中剪切梯度的任何变量上使用该函数!

我仍然应该看到我的结果。

编辑 2. 更改后的型号代码为:

培训由

现在仍在训练中,但现在低至-10。

0 投票
0 回答
43 浏览

python - 如何迭代地在python中手动标记unicode文本

我想在 python/opencv 中标记 unicode 手写字符。我有一个分段的文本图像,我想通过直观地查看图像并手动标记它们以将它们用作训练集来迭代地标记它。

你能告诉我如何在 python 中将手写字符与 unicode 字符匹配吗?例如,具有匹配 unicode 标签的手写字符列表。

0 投票
1 回答
488 浏览

python - 手写文本识别(CNN + LSTM + CTC)RNN解释需要

我正在尝试理解以下代码,它位于 python 和 tensorflow 中。我正在尝试实现手写文本识别。我在这里指的是以下代码

我不明白为什么 RNN 输出通过“atrous_conv2d”

这是我的模型的架构,接受一个 CNN 输入并传入这个 RNN 进程,然后将其传递给一个 CTC。

0 投票
0 回答
71 浏览

azure - Azure API for Handwritten text 给出 202 错误代码

我可以毫无问题地使用分析图像和描述图像 API。但是,识别手写 API 给我带来了问题。我收到 202 Accepted 响应,但是当我从响应标头转到 operation-location 字段中提供的链接时,我看到此错误:

{ 错误:{ 代码:“401”,消息:“由于订阅密钥无效或 API 端点错误,访问被拒绝。确保为活动订阅提供有效密钥,并为您的资源使用正确的区域 API 端点。” } }

我尝试使用以下链接:

https://eastus.dev.cognitive.microsoft.com

并得到回应:

响应状态 202 已接受

响应延迟 133 ms 响应内容 Pragma: no-cache Operation-Location: https://eastus.api.cognitive.microsoft.com/vision/v2.0/textOperations/6bbfc38e-c67e-4537-9814-62eaef16d81b apim-request- id:7d9e7188-d806-4d10-98fe-b8fd940e9390 严格传输安全:max-age=31536000;包括子域;预加载 x-content-type-options: nosniff Cache-Control: no-cache 日期: 2019 年 7 月 26 日星期五 10:01:40 GMT X-AspNet-Version: 4.0.30319 X-Powered-By: ASP.NET Content-长度:0 过期:-1