问题标签 [tessnet2]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

60 问题

0 投票

1 回答

430 浏览

screen - 屏幕抓取工具

我使用过 Screen Scraper Studio，它有一个互操作 dll，允许您传入坐标，它会抓取该区域，我实际上只是想抓取一个 4 位数字，但是这个应用程序需要相当昂贵的开发人员许可证。是否有其他开箱即用的程序，只需要很少的编码，我可以在其中传递一些坐标？我不想使用 TESSnet2 ocr 包，因为它需要使用 C# 进行相当多的设置。有任何想法吗？

2012-09-29T14:56:58.083

0 投票

1 回答

2401 浏览

c# - 找不到使 tessnet2 工作的方法

我创建了一个控制台应用程序。添加了对 tessnet2_32 的引用。

我也尝试更改"C:\temp\tessdata"为

该tessdata文件夹本身包含 9 个失败并被添加到所有这些位置：

但它总是存在于 .Init 行并带有一条消息：

我无法想象为什么它在我只有 C 的时候试图访问一些 Z 磁盘。或者我完全误解了这个错误。

有人可以逐步发布告诉我该做什么和/或我做错了什么吗？即使在阅读了 30 多个谷歌链接后，我也感到完全失落。

c#tesseract object-recognition tessnet2

2013-02-25T13:04:18.040

0 投票

1 回答

876 浏览

vb.net - 为什么 Tessnet2 OCR 结果不好

我正在使用 tessnet2 从 .tif 图像中获取文本。例如，我想从图像中获取十进制“700”，但我得到了这个：“Mupann”我正在使用法语 tessdata 这里我正在使用的代码：

谢谢

vb.net ocr tessnet2

2013-03-16T19:22:48.707

0 投票

2 回答

4231 浏览

c# - Tessnet2 Init-Method 在某些 tessdata 路径下崩溃

我正在使用 Tessnet2 程序集（它使用 Tesseract）来进行 OCR。不幸的是，在我调用 init 方法后程序崩溃，没有任何异常：

德语文件夹包含以下 tesseract 2 字数据：

deu.DangAmigs
deu.freq-dawg
deu.inttemp
deu.normproto
deu.pffmtable
deu.unicharset
deu.user-words
deu.word-dawg

如果我使用null路径它工作正常，因为我在我的机器上安装了 tesseract。但是我需要一个带有路径的解决方案，因为将部署程序的位置不能确保安装了 tesseract。

c#ocr tesseract tessnet2

2013-03-25T14:53:39.400

0 投票

2 回答

1620 浏览

c# - Tessnet2 OCR 只返回数字

我正在尝试在 ac# 应用程序中使用 tessnet2 从图像中读取文本。这是我的代码：

结果字符串只包含数字，但我的图片包含字母，我不明白为什么。

谢谢

c#ocr tesseract tessnet2

2013-04-05T13:45:55.783

0 投票

1 回答

1459 浏览

c# - Tessnet2 只返回一个字符

我正在编写一个应用程序，我想读取图像并提取文本。为了测试 porpuses，我传入了一个包含 6 个字符的图像。这是我的代码。

结果是 100 : ~

我第二次运行它返回：

100：-

请帮忙！！！谢谢

c#.net ocr tesseract tessnet2

2013-05-08T18:29:04.683

0 投票

2 回答

5715 浏览

c# - c# PDF 转 Bmp 免费

我正在编写一个使用 OCR (tessnet2) 扫描图像文件并提取某些信息的程序。在我发现要从 Exchange 服务器扫描 PDF 附件之前，这很容易。

我正在处理的第一个问题是如何将我的 PDF 转换为 BMP 文件。就我目前所知的 TessNet2 而言，它只能读取图像文件——特别是 BMP。所以我现在的任务是将不确定大小（2 - 15 页）的 PDF 转换为 BMP 图像。完成后，我可以使用我已经用 TessNet2 构建的代码轻松扫描每个图像。

我已经看到使用 Ghostscript 来完成这项任务的事情——我只是想知道是否有另一种免费的解决方案，或者你们中的一个优秀的人是否可以给我一个关于如何使用 Ghostscript 执行此操作的速成课程。

c#pdf ghostscript bmp tessnet2

2013-07-09T21:39:29.493

0 投票

3 回答

5401 浏览

c# - c# foreach 文件夹中的图像

下面是一些代码

创建一个目录
使用 MagickNet 将 PDF 转换为单独的 BMP 图像并将其存储在文件夹中 (ImagePath)
然后它使用 TessNet2 扫描该文件夹中的每个图像以解析出信息

我似乎无法获得扫描 ImagePath 文件夹的 foreach 循环。有什么帮助吗？

现在的错误在'foreach'语句上，它说“无法将类型'char'转换为'System.Drawing.Image'”

c#image foreach tessnet2 magicknet

2013-07-10T22:25:22.013

0 投票

2 回答

946 浏览

c# - OCR文字识别逻辑

下面是一个函数，它使用 TessNet2（OCR 框架）扫描由 TessNet2 内置的 OCR 函数捕获的单词列表。由于我扫描的页面质量不够完美，因此单词的检测不是 100% 准确的。

因此，有时它会将“S”与“5”或“l”与“1”混淆。此外，它不考虑大小写。所以我必须搜索这两种情况。

它的工作方式是我在纸上搜索某些彼此接近的单词。所以第一组词[I]是“Abstracting Service Ordered”。如果页面包含彼此相邻的这些单词，则它会移动到下一组单词 [j]，然后是下一个 [h]。如果页面包含所有 3 组单词，则返回 true。

这是我想到的最好的方法，但我希望这里有人可以给我另一种尝试的方法。

c#ocr tessnet2

2013-07-11T15:56:03.287

0 投票

1 回答

1024 浏览

c# - 在字符串之后查找下一个单词

所以我有下面的方法，它将扫描单词列表，找到“控制号：”并将其设置为 wordNumber，然后将下一个单词设置为 controlNum（这是我要返回的字符串）。

但是在找出如何使用 RegEx 使用类似方法之后。我想看看是否有办法将 controlNum 设置为下一个单词。对于某些字母/数字，我有几种不同的情况，以防找不到确切的单词。

c#regex ocr tessnet2

2013-07-11T18:02:54.623

1 2 3 4 5 6 7 8 9 10

问题标签 [tessnet2]

Reference