问题标签 [tessnet2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
screen - 屏幕抓取工具
我使用过 Screen Scraper Studio,它有一个互操作 dll,允许您传入坐标,它会抓取该区域,我实际上只是想抓取一个 4 位数字,但是这个应用程序需要相当昂贵的开发人员许可证。是否有其他开箱即用的程序,只需要很少的编码,我可以在其中传递一些坐标?我不想使用 TESSnet2 ocr 包,因为它需要使用 C# 进行相当多的设置。有任何想法吗?
c# - 找不到使 tessnet2 工作的方法
我创建了一个控制台应用程序。添加了对 tessnet2_32 的引用。
我也尝试更改"C:\temp\tessdata"
为
该tessdata
文件夹本身包含 9 个失败并被添加到所有这些位置:
但它总是存在于 .Init 行并带有一条消息:
我无法想象为什么它在我只有 C 的时候试图访问一些 Z 磁盘。或者我完全误解了这个错误。
有人可以逐步发布告诉我该做什么和/或我做错了什么吗?即使在阅读了 30 多个谷歌链接后,我也感到完全失落。
vb.net - 为什么 Tessnet2 OCR 结果不好
我正在使用 tessnet2 从 .tif 图像中获取文本。例如,我想从图像中获取十进制“700”,但我得到了这个:“Mupann”我正在使用法语 tessdata 这里我正在使用的代码:
谢谢
c# - Tessnet2 Init-Method 在某些 tessdata 路径下崩溃
我正在使用 Tessnet2 程序集(它使用 Tesseract)来进行 OCR。不幸的是,在我调用 init 方法后程序崩溃,没有任何异常:
德语文件夹包含以下 tesseract 2 字数据:
- deu.DangAmigs
- deu.freq-dawg
- deu.inttemp
- deu.normproto
- deu.pffmtable
- deu.unicharset
- deu.user-words
- deu.word-dawg
如果我使用null
路径它工作正常,因为我在我的机器上安装了 tesseract。但是我需要一个带有路径的解决方案,因为将部署程序的位置不能确保安装了 tesseract。
c# - Tessnet2 OCR 只返回数字
我正在尝试在 ac# 应用程序中使用 tessnet2 从图像中读取文本。这是我的代码:
结果字符串只包含数字,但我的图片包含字母,我不明白为什么。
谢谢
c# - Tessnet2 只返回一个字符
我正在编写一个应用程序,我想读取图像并提取文本。为了测试 porpuses,我传入了一个包含 6 个字符的图像。这是我的代码。
结果是 100 : ~
我第二次运行它返回:
100:-
请帮忙!!!谢谢
c# - c# PDF 转 Bmp 免费
我正在编写一个使用 OCR (tessnet2) 扫描图像文件并提取某些信息的程序。在我发现要从 Exchange 服务器扫描 PDF 附件之前,这很容易。
我正在处理的第一个问题是如何将我的 PDF 转换为 BMP 文件。就我目前所知的 TessNet2 而言,它只能读取图像文件——特别是 BMP。所以我现在的任务是将不确定大小(2 - 15 页)的 PDF 转换为 BMP 图像。完成后,我可以使用我已经用 TessNet2 构建的代码轻松扫描每个图像。
我已经看到使用 Ghostscript 来完成这项任务的事情——我只是想知道是否有另一种免费的解决方案,或者你们中的一个优秀的人是否可以给我一个关于如何使用 Ghostscript 执行此操作的速成课程。
c# - c# foreach 文件夹中的图像
下面是一些代码
- 创建一个目录
- 使用 MagickNet 将 PDF 转换为单独的 BMP 图像并将其存储在文件夹中 (ImagePath)
- 然后它使用 TessNet2 扫描该文件夹中的每个图像以解析出信息
我似乎无法获得扫描 ImagePath 文件夹的 foreach 循环。有什么帮助吗?
现在的错误在'foreach'语句上,它说“无法将类型'char'转换为'System.Drawing.Image'”
c# - OCR文字识别逻辑
下面是一个函数,它使用 TessNet2(OCR 框架)扫描由 TessNet2 内置的 OCR 函数捕获的单词列表。由于我扫描的页面质量不够完美,因此单词的检测不是 100% 准确的。
因此,有时它会将“S”与“5”或“l”与“1”混淆。此外,它不考虑大小写。所以我必须搜索这两种情况。
它的工作方式是我在纸上搜索某些彼此接近的单词。所以第一组词[I]是“Abstracting Service Ordered”。如果页面包含彼此相邻的这些单词,则它会移动到下一组单词 [j],然后是下一个 [h]。如果页面包含所有 3 组单词,则返回 true。
这是我想到的最好的方法,但我希望这里有人可以给我另一种尝试的方法。
c# - 在字符串之后查找下一个单词
所以我有下面的方法,它将扫描单词列表,找到“控制号:”并将其设置为 wordNumber,然后将下一个单词设置为 controlNum(这是我要返回的字符串)。
但是在找出如何使用 RegEx 使用类似方法之后。我想看看是否有办法将 controlNum 设置为下一个单词。对于某些字母/数字,我有几种不同的情况,以防找不到确切的单词。