问题标签 [text-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 寻找一点python机器学习建议
我有兴趣涉足 Python 和机器学习/自动数据输入。然而,随着我的研究进展,我意识到有很多不同的技术,每一种都有自己的优势。
我已经决定,如果我朝相反的方向学习,我可能会走得更远。即选择一个问题/任务并通过解决/完成它来学习。
我偶尔需要对传真的发票进行数据处理,我希望制作一个程序,一旦我扫描后就可以为我输入这些发票。
传真基本上由 2 个相同的表格组成。每行表示一个单独的工人。第 1 列是工人姓名(选择 6) 第 2 列是地址,其余列是表示不同工作的复选框。页面顶部的框中还有一个发票 ID。
我希望有人能简要解释一下他们将如何解决这个问题。他们是否会使用 SVM 进行文本识别或其他技术?以及如何让程序理解第 5 个框中的勾号表示“已清理=是”,左上角框中的数字是 ID。我做了一些研究,但不知道如何开始。当您由于传真/扫描而无法保证绝对位置/大小时,如何将传真的某些部分(例如顶部表格及其单元格)与页面的其余部分隔离开来。还是我得弄几百份传真+这些传真打出来的数据,然后比较,然后让它自己慢慢了解传真a和b的区别在这里是打勾,ID号通常在这里......
欢迎任何建议!
r - 文本挖掘 pdf 文件/词频问题
我正在尝试挖掘具有丰富 pdf 编码和图形的文章的 pdf。我注意到,当我挖掘一些 pdf 文档时,我得到的高频词是 phi、taeoe、toe、sigma、gamma 等。它适用于一些 pdf 文档,但我会得到这些随机的希腊字母。这是字符编码的问题吗?(顺便说一句,所有文件都是英文的)。有什么建议么?
image-processing - 我收到“无法搜索!” 当我在 jTessBoxEditor 中打开一个 tiff 文件时
我对 jTessBoxEditor 有疑问。我可以从图片生成盒子文件,但是当我尝试打开图像以修改盒子文件时,我收到来自 jTessBoxEditor 的错误“Couldn't seek”。我在linux和windows上都试过这个,我收到了同样的结果......
如何在 jTessBoxEditor 中打开图片并修改文件?
谢谢。
java - Tesseract 没有给出识别结果(Android studio;Java)
我正在使用 tesseract OCR 在 Android Studio 上制作应用程序。我制作了一个代码,它应该可以识别手机摄像头拍摄的图像上的文字。问题:tesseract 函数 getUTF8Text() 根本没有给出任何结果(null,尽管图片带有文本)。程序没有给出任何错误。
我想知道可能的问题: 1. 也许我没有正确地将 tesseract 集成到我的项目中?(编译器在代码中使用 tesseract 类时没有显示任何问题) 2. 代码中可能有问题?(错误的训练数据路径??)。
主类: 代码:
用于 tesseract 训练数据文件查找或添加和文本识别的 TessOCR 类(构造函数仅用于查找训练数据文件):
- 如果这个问题是由于tesseract集成不好引起的,请发一个正确的教程来说明如何集成它,因为互联网上的每个教程都不一样,很难理解如何正确地做。
android - android中的Tesseract最大识别时间
我在android中的tesseract识别时间有问题,识别文本需要太多时间。在 ios 中,它具有提供 tesseract 最大识别时间的功能,例如tesseract.maximumRecognitionTime = 60.0
. 有什么办法可以让 tesseract 在像 ios 这样的 android 中获得最大识别时间?(我正在使用 tess 两个库https://github.com/rmtheis/tess-two)
ios - 如何标记纬度/经度文本,以便在作为电子邮件发送时识别为位置
我允许我的用户共享消息并以不同的方式与他人共享它们。例如。脸书或电邮...
如果文本包含纬度/经度,并且用户共享此消息,我希望它被 FB、电子邮件...识别为一个位置,以便消息的接收者只需点击文本并被带到他们的地图应用。
这可能吗 ?
谢了,兄弟们
unity3d - 增强现实:识别手写数字?
正如主题所说,我正在尝试为这个 AR 应用程序找到一个解决方案。
我希望我的应用程序能够识别用户手写的数字。
该应用程序将告诉用户在纸上写下例如数字 24,然后将相机移动到写下的数字上以查看 3d 对象。
这可能用于保存生日、婚礼日期等
为准确起见,应用说明将向用户显示预览,告诉用户请写出与此类似的数字 24。
虽然每个手写体都会有所不同,但至少我们不会得到带有开放边缘的卷曲“2”-s 或“4” ..etc
所以这里我们需要AR来识别数字,或者能够根据近似值来读取数字。
第一个问题是:这种行为是否可行或任何熟悉类似概念的人?
在搜索了类似的应用程序后,我找到了纹身预览-s的“墨水猎人”应用程序,虽然这些应用程序使用符号而不是数字,但我们也可以将数字视为符号。
同样正如这段视频:https ://www.youtube.com/watch?v=9rXJcIE2Fcs所示,每个用户都以不同的方式绘制符号,但他们仍然可以正常工作。
我正在使用 Unity3d 和 Vuforia。Vuforia 在网站上提供免费示例(unity3d 包),其中有一个名为“文本识别”,教程链接如下:https ://www.youtube.com/watch?v=W3MK6nC5FWE
但不幸的是无法使其工作。
如果有人使用 vuforia 的这些示例项目开发了这样的功能或有任何其他方法,请我需要你的帮助:)
在此先感谢莫格斯
image-processing - 我在哪里可以获得用于 OCR(光学字符识别)的服务器端 api?
抱歉,如果这个问题很愚蠢或含糊不清,但我的任务是在实习期间在服务器端实现 ocr。我在哪里可以获得合适的 api 以将其与我公司的网站集成。我曾尝试使用 microsoft vision api,但不知道如何将其发送到服务器!我是IT领域的新手。因此,请帮助我提出您宝贵的建议。谢谢!