“text-recognition”的相关标签问题

0 投票

1 回答

134 浏览

python - 寻找一点python机器学习建议

我有兴趣涉足 Python 和机器学习/自动数据输入。然而，随着我的研究进展，我意识到有很多不同的技术，每一种都有自己的优势。

我已经决定，如果我朝相反的方向学习，我可能会走得更远。即选择一个问题/任务并通过解决/完成它来学习。

我偶尔需要对传真的发票进行数据处理，我希望制作一个程序，一旦我扫描后就可以为我输入这些发票。

传真基本上由 2 个相同的表格组成。每行表示一个单独的工人。第 1 列是工人姓名（选择 6）第 2 列是地址，其余列是表示不同工作的复选框。页面顶部的框中还有一个发票 ID。

我希望有人能简要解释一下他们将如何解决这个问题。他们是否会使用 SVM 进行文本识别或其他技术？以及如何让程序理解第 5 个框中的勾号表示“已清理=是”，左上角框中的数字是 ID。我做了一些研究，但不知道如何开始。当您由于传真/扫描而无法保证绝对位置/大小时，如何将传真的某些部分（例如顶部表格及其单元格）与页面的其余部分隔离开来。还是我得弄几百份传真+这些传真打出来的数据，然后比较，然后让它自己慢慢了解传真a和b的区别在这里是打勾，ID号通常在这里......

欢迎任何建议！

2015-08-19T07:25:26.140

0 投票

1 回答

917 浏览

r - 文本挖掘 pdf 文件/词频问题

我正在尝试挖掘具有丰富 pdf 编码和图形的文章的 pdf。我注意到，当我挖掘一些 pdf 文档时，我得到的高频词是 phi、taeoe、toe、sigma、gamma 等。它适用于一些 pdf 文档，但我会得到这些随机的希腊字母。这是字符编码的问题吗？（顺便说一句，所有文件都是英文的）。有什么建议么？

r pdf ghostscript tm text-recognition

2015-09-09T11:45:03.967

0 投票

2 回答

941 浏览

image-processing - 我收到“无法搜索！” 当我在 jTessBoxEditor 中打开一个 tiff 文件时

我对 jTessBoxEditor 有疑问。我可以从图片生成盒子文件，但是当我尝试打开图像以修改盒子文件时，我收到来自 jTessBoxEditor 的错误“Couldn't seek”。我在linux和windows上都试过这个，我收到了同样的结果......

如何在 jTessBoxEditor 中打开图片并修改文件？

谢谢。

image-processing ocr tesseract text-recognition

2015-11-14T21:23:25.903

0 投票

1 回答

1516 浏览

android - Android-Java 检测文本方向并为 ocr 旋转图像

OCR我在 Android（或 iOS）上使用读卡。但在这个过程中，如果成功了，也不是天翻地覆。但性格错误，进程失败。我正在使用tesserat和opencv algoritms。

像这张图片的例子。我怎么能detect text orientation和rotate image。

android orientation ocr tesseract text-recognition

2015-11-19T16:35:54.763

0 投票

2 回答

1118 浏览

java - Tesseract 没有给出识别结果（Android studio；Java）

我正在使用 tesseract OCR 在 Android Studio 上制作应用程序。我制作了一个代码，它应该可以识别手机摄像头拍摄的图像上的文字。问题：tesseract 函数 getUTF8Text() 根本没有给出任何结果（null，尽管图片带有文本）。程序没有给出任何错误。

我想知道可能的问题： 1. 也许我没有正确地将 tesseract 集成到我的项目中？（编译器在代码中使用 tesseract 类时没有显示任何问题） 2. 代码中可能有问题？（错误的训练数据路径？？）。

主类：代码：

用于 tesseract 训练数据文件查找或添加和文本识别的 TessOCR 类（构造函数仅用于查找训练数据文件）：

如果这个问题是由于tesseract集成不好引起的，请发一个正确的教程来说明如何集成它，因为互联网上的每个教程都不一样，很难理解如何正确地做。

java android-studio ocr tesseract text-recognition

2016-01-03T21:25:49.560

0 投票

2 回答

1989 浏览

image-processing - 建议过滤器提高照片上的文字可见度

我需要过滤器来提高照片上的文本可见性，因为它有一些噪音。为此，您知道哪些过滤器（算法）？

现在，我使用单色滤镜，但它并没有提高图像质量。我需要过滤可以确定小区域的中等背景并根据中等背景使图像单色。

例如，几乎所有图片背景都是白色和灰色字符，但某些区域具有较深的颜色（灰色）和黑色字符。我需要算法才能理解图像的某些区域更暗，并使黑色接受程度更低。

例如，源图像：和处理后的照片（中值、单色滤镜）

image-processing text-recognition

2016-02-08T18:20:39.993

0 投票

1 回答

588 浏览

android - android中的Tesseract最大识别时间

我在android中的tesseract识别时间有问题，识别文本需要太多时间。在 ios 中，它具有提供 tesseract 最大识别时间的功能，例如tesseract.maximumRecognitionTime = 60.0. 有什么办法可以让 tesseract 在像 ios 这样的 android 中获得最大识别时间？（我正在使用 tess 两个库https://github.com/rmtheis/tess-two）

android tesseract tess-two text-recognition

2016-02-19T08:55:43.577

0 投票

1 回答

34 浏览

ios - 如何标记纬度/经度文本，以便在作为电子邮件发送时识别为位置

我允许我的用户共享消息并以不同的方式与他人共享它们。例如。脸书或电邮...

如果文本包含纬度/经度，并且用户共享此消息，我希望它被 FB、电子邮件...识别为一个位置，以便消息的接收者只需点击文本并被带到他们的地图应用。

这可能吗？

谢了，兄弟们

ios location text-recognition

2016-05-31T11:08:58.983

0 投票

1 回答

1262 浏览

unity3d - 增强现实：识别手写数字？

正如主题所说，我正在尝试为这个 AR 应用程序找到一个解决方案。

我希望我的应用程序能够识别用户手写的数字。

该应用程序将告诉用户在纸上写下例如数字 24，然后将相机移动到写下的数字上以查看 3d 对象。

这可能用于保存生日、婚礼日期等

为准确起见，应用说明将向用户显示预览，告诉用户请写出与此类似的数字 24。

虽然每个手写体都会有所不同，但至少我们不会得到带有开放边缘的卷曲“2”-s 或“4” ..etc

所以这里我们需要AR来识别数字，或者能够根据近似值来读取数字。

第一个问题是：这种行为是否可行或任何熟悉类似概念的人？

在搜索了类似的应用程序后，我找到了纹身预览-s的“墨水猎人”应用程序，虽然这些应用程序使用符号而不是数字，但我们也可以将数字视为符号。

同样正如这段视频：https ://www.youtube.com/watch?v=9rXJcIE2Fcs所示，每个用户都以不同的方式绘制符号，但他们仍然可以正常工作。

我正在使用 Unity3d 和 Vuforia。Vuforia 在网站上提供免费示例（unity3d 包），其中有一个名为“文本识别”，教程链接如下：https ://www.youtube.com/watch?v=W3MK6nC5FWE

但不幸的是无法使其工作。

如果有人使用 vuforia 的这些示例项目开发了这样的功能或有任何其他方法，请我需要你的帮助:)

在此先感谢莫格斯

unity3d numbers augmented-reality symbols text-recognition

2016-06-09T04:47:48.703

0 投票

2 回答

1019 浏览

image-processing - 我在哪里可以获得用于 OCR（光学字符识别）的服务器端 api？

抱歉，如果这个问题很愚蠢或含糊不清，但我的任务是在实习期间在服务器端实现 ocr。我在哪里可以获得合适的 api 以将其与我公司的网站集成。我曾尝试使用 microsoft vision api，但不知道如何将其发送到服务器！我是IT领域的新手。因此，请帮助我提出您宝贵的建议。谢谢！

image-processing ocr text-recognition microsoft-ocr

2016-06-09T07:44:30.490

问题标签 [text-recognition]

Reference