问题标签 [text-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
134 浏览

python - 寻找一点python机器学习建议

我有兴趣涉足 Python 和机器学习/自动数据输入。然而,随着我的研究进展,我意识到有很多不同的技术,每一种都有自己的优势。

我已经决定,如果我朝相反的方向学习,我可能会走得更远。即选择一个问题/任务并通过解决/完成它来学习。

我偶尔需要对传真的发票进行数据处理,我希望制作一个程序,一旦我扫描后就可以为我输入这些发票。

传真基本上由 2 个相同的表格组成。每行表示一个单独的工人。第 1 列是工人姓名(选择 6) 第 2 列是地址,其余列是表示不同工作的复选框。页面顶部的框中还有一个发票 ID。

我希望有人能简要解释一下他们将如何解决这个问题。他们是否会使用 SVM 进行文本识别或其他技术?以及如何让程序理解第 5 个框中的勾号表示“已清理=是”,左上角框中的数字是 ID。我做了一些研究,但不知道如何开始。当您由于传真/扫描而无法保证绝对位置/大小时,如何将传真的某些部分(例如顶部表格及其单元格)与页面的其余部分隔离开来。还是我得弄几百份传真+这些传真打出来的数据,然后比较,然后让它自己慢慢了解传真a和b的区别在这里是打勾,ID号通常在这里......

欢迎任何建议!

0 投票
1 回答
917 浏览

r - 文本挖掘 pdf 文件/词频问题

我正在尝试挖掘具有丰富 pdf 编码和图形的文章的 pdf。我注意到,当我挖掘一些 pdf 文档时,我得到的高频词是 phi、taeoe、toe、sigma、gamma 等。它适用于一些 pdf 文档,但我会得到这些随机的希腊字母。这是字符编码的问题吗?(顺便说一句,所有文件都是英文的)。有什么建议么?

0 投票
2 回答
941 浏览

image-processing - 我收到“无法搜索!” 当我在 jTessBoxEditor 中打开一个 tiff 文件时

我对 jTessBoxEditor 有疑问。我可以从图片生成盒子文件,但是当我尝试打开图像以修改盒子文件时,我收到来自 jTessBoxEditor 的错误“Couldn't seek”。我在linux和windows上都试过这个,我收到了同样的结果......

如何在 jTessBoxEditor 中打开图片并修改文件?

谢谢。

0 投票
1 回答
1516 浏览

android - Android-Java 检测文本方向并为 ocr 旋转图像

OCR我在 Android(或 iOS)上使用读卡。但在这个过程中,如果成功了,也不是天翻地覆。但性格错误,进程失败。我正在使用tesseratopencv algoritms

像这张图片的例子。我怎么能detect text orientationrotate image

在此处输入图像描述

0 投票
2 回答
1118 浏览

java - Tesseract 没有给出识别结果(Android studio;Java)

我正在使用 tesseract OCR 在 Android Studio 上制作应用程序。我制作了一个代码,它应该可以识别手机摄像头拍摄的图像上的文字。问题:tesseract 函数 getUTF8Text() 根本没有给出任何结果(null,尽管图片带有文本)。程序没有给出任何错误。

我想知道可能的问题: 1. 也许我没有正确地将 tesseract 集成到我的项目中?(编译器在代码中使用 tesseract 类时没有显示任何问题) 2. 代码中可能有问题?(错误的训练数据路径??)。

主类: 代码:

用于 tesseract 训练数据文件查找或添加和文本识别的 TessOCR 类(构造函数仅用于查找训练数据文件):

  • 如果这个问题是由于tesseract集成不好引起的,请发一个正确的教程来说明如何集成它,因为互联网上的每个教程都不一样,很难理解如何正确地做。
0 投票
2 回答
1989 浏览

image-processing - 建议过滤器提高照片上的文字可见度

我需要过滤器来提高照片上的文本可见性,因为它有一些噪音。为此,您知道哪些过滤器(算法)?

现在,我使用单色滤镜,但它并没有提高图像质量。我需要过滤可以确定小区域的中等背景并根据中等背景使图像单色。

例如,几乎所有图片背景都是白色和灰色字符,但某些区域具有较深的颜色(灰色)和黑色字符。我需要算法才能理解图像的某些区域更暗,并使黑色接受程度更低。


例如,源图像: 和处理后的照片(中值、单色滤镜) 照片
处理过的照片

0 投票
1 回答
588 浏览

android - android中的Tesseract最大识别时间

我在android中的tesseract识别时间有问题,识别文本需要太多时间。在 ios 中,它具有提供 tesseract 最大识别时间的功能,例如tesseract.maximumRecognitionTime = 60.0. 有什么办法可以让 tesseract 在像 ios 这样的 android 中获得最大识别时间?(我正在使用 tess 两个库https://github.com/rmtheis/tess-two

0 投票
1 回答
34 浏览

ios - 如何标记纬度/经度文本,以便在作为电子邮件发送时识别为位置

我允许我的用户共享消息并以不同的方式与他人共享它们。例如。脸书或电邮...

如果文本包含纬度/经度,并且用户共享此消息,我希望它被 FB、电子邮件...识别为一个位置,以便消息的接收者只需点击文本并被带到他们的地图应用。

这可能吗 ?

谢了,兄弟们

0 投票
1 回答
1262 浏览

unity3d - 增强现实:识别手写数字?

正如主题所说,我正在尝试为这个 AR 应用程序找到一个解决方案。

我希望我的应用程序能够识别用户手写的数字。

该应用程序将告诉用户在纸上写下例如数字 24,然后将相机移动到写下的数字上以查看 3d 对象。

这可能用于保存生日、婚礼日期等

为准确起见,应用说明将向用户显示预览,告诉用户请写出与此类似的数字 24。

虽然每个手写体都会有所不同,但至少我们不会得到带有开放边缘的卷曲“2”-s 或“4” ..etc

所以这里我们需要AR来识别数字,或者能够根据近似值来读取数字。

第一个问题是:这种行为是否可行或任何熟悉类似概念的人?

在搜索了类似的应用程序后,我找到了纹身预览-s的“墨水猎人”应用程序,虽然这些应用程序使用符号而不是数字,但我们也可以将数字视为符号。

同样正如这段视频:https ://www.youtube.com/watch?v=9rXJcIE2Fcs所示,每个用户都以不同的方式绘制符号,但他们仍然可以正常工作。

我正在使用 Unity3d 和 Vuforia。Vuforia 在网站上提供免费示例(unity3d 包),其中有一个名为“文本识别”,教程链接如下:https ://www.youtube.com/watch?v=W3MK6nC5FWE

但不幸的是无法使其工作。

如果有人使用 vuforia 的这些示例项目开发了这样的功能或有任何其他方法,请我需要你的帮助:)

在此先感谢莫格斯

0 投票
2 回答
1019 浏览

image-processing - 我在哪里可以获得用于 OCR(光学字符识别)的服务器端 api?

抱歉,如果这个问题很愚蠢或含糊不清,但我的任务是在实习期间在服务器端实现 ocr。我在哪里可以获得合适的 api 以将其与我公司的网站集成。我曾尝试使用 microsoft vision api,但不知道如何将其发送到服务器!我是IT领域的新手。因此,请帮助我提出您宝贵的建议。谢谢!