问题标签 [tessnet2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
682 浏览

c# - Tessnet2 (Tesseract) 没有返回正确的结果 - 提高输出的方法

我在下图中的 C# 中使用 tessnet2 (tesseract-ocr):

示例文本图像

这是我的代码:

给出输出:Icurumcretz j

有什么方法可以获得正确的结果文本作为示例图像非常清晰且具有良好的分辨率,但仍然没有给出正确的文本。需要定义哪些参数才能获得正确的结果。请回复。

0 投票
2 回答
1913 浏览

c# - WebForms .Net 中的 Tessnet2 返回 DllNotFoundException liblept172.dll

我使用 Tessnet2 编写了一个基本应用程序,现在尝试将其移至 WebForms 网站。

复制了逻辑等,但是当我运行它时,我收到一条错误消息(异常:DllNotFoundException)

如上所述,此代码用作 C# 控制台,在应用必要的逻辑将其移动到网站后,我认为我正确移动了所有内容,但不断收到此错误。有什么想法在哪里看?

编辑2:

挖得更深一点,失败的部分实际上是 ILibraryLoaderLogic

即使文件确实存在?(似乎有什么平台差异

当控制台在 x64 下运行但网站在 x86 下运行时返回)

0 投票
0 回答
781 浏览

c# - tessnet2 语言文件或培训

我对 tessnet2 很陌生。所以我使用 Tessnet2 因为我在 C# 语言中使用 OCR。所以我将 tessnet_32.dll 添加到引用中以使 OCR 工作。但是,我遇到了一个问题。

由于 tessnet2 是 tesseract2.0,我不能使用 tesseract github 中的所有语言文件。因此我的问题是:

1)我是否可以提取 lang.traineddata 并获取所有 8 个可以在 tessnet2 中使用的文件?2)如果没有,谁能解释我如何训练数据以添加新语言?(如韩文或日文)?我知道https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract2有所有步骤。但是当我使用命令行时,我什么也得不到。换句话说,我一直在做一个盒子。如果有人可以向我解释如何通过安装 tesseract 2.0 来训练数据,那就太好了。

感谢你们对我的帮助。

0 投票
1 回答
149 浏览

c# - Tessnet 2 返回错误的结果

我试图在从使用 getwindow 函数创建的屏幕截图返回的位图上运行 tessnet,但结果很糟糕。我试图在一个保存在paint中的bmp文件上运行。此图像与使用 getwindow 创建的图像相同,为此 tessnet 工作。这是图像任何想法?

0 投票
0 回答
188 浏览

c# - 当设置“tessedit_char_whitelist”并完成 ocr 时,Tesseract 会为同一图像提供不同的结果

我正在使用 tesseract 在扫描图像中查找文本,

我试图通过如下调用来设置“tessedit_char_whitelist”,以便只执行字母数字搜索

tes_obj.SetVariable("tessedit_char_whitelist", "abcdefghijklmnopqrstuvwxyz012345789ABCDEFGHIJKLMNOPQRSTUVWXYZ");

当我尝试比较同一图像上多次搜索的结果时,我发现了不同的结果。不同结果的原因可能是什么。

问候, 阿姆鲁特

0 投票
1 回答
197 浏览

tesseract - 为什么 Tessnet2 无法提取文本?

我用"tessnet2_64.dll" 在此处输入图像描述

这是我的代码,提取文本:

结果输出:

如何提取文本"Hello"?谢谢大家。

0 投票
0 回答
534 浏览

c# - Tesseract (tessnet2) 无法读取简单数字

我设计了一个简单的代码来从图像中提取文本。图像仅包含数字。这是图像,我要转换:

第一张图片

第二张图片

第三张图片

OCR转换的结果总是~

对于这两个图像,OCR 转换给出的结果有一些错误:

第一张照片与

第二张图片

这是我的代码:

在文档中,“Tesseract”是最好的开源 OCR 库,Google 几乎没有改进 - 但结果极差。

是否有一些设置,我可以更改以获得更好的结果?

0 投票
1 回答
430 浏览

c# - c# - 无法使用 tessnet2 和 Tesseract-OCR 从图像中读取带圆圈的文本

我正在尝试编写将文本从 jpg 更改为控制台的代码。我曾经写过:tessnet2 和 Tesseract-OCR(在 c# 中)。现在,当我有纯文本时,一切都可以正常工作,但问题是当文本像这样在圆圈中时:

在此处输入图像描述

实际上控制台返回我这个:

有时它会将 @ 更改为 ~(取决于圆圈的大小)。有我的代码:

有人能告诉我我应该怎么做才能阅读这篇文章吗?

0 投票
1 回答
43 浏览

c# - Tessnet2 关闭程序与 System.AccessViolationException

我在这里得到 System.AccessViolationException:List<tessnet2.Word> result = ocr.DoOCR(image, Rectangle.Empty);

库tessnet2.dll for x86,跟x64情况一样。

0 投票
1 回答
53 浏览

sharepoint - Tesseract OCR.init() 使代码退出 Sharepoint 网站

我们正在使用 Tesseract OCR (tessnet2 dll) 将图像转换为在控制台应用程序中运行良好的文本。但是,当我们在 sharepoint 中托管相同的内容时,应用程序会在 ocr.init() 处退出。在一些帖子中,提到 tessdata 文件夹应该在 bin/debug 下。但是,对于共享点站点,我需要在哪里保留 tessdata 文件夹?

提前致谢