问题标签 [ocr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2471 浏览

ocr - 如何让索引服务和 MODI 通过 OCR 生成全文?

我已配置索引服务来索引我的文件,其中还包括保存为高分辨率TIFF文件的扫描图像。我还安装了 MS Office 2003+ 并正确配置了 MS Office Document Imaging (MODI),因此我可以对我的图像执行OCR,甚至可以将OCR的文本嵌入到 TIFF 中。

索引服务能够索引和查找那些手动 OCR 并使用文本数据重新保存的TIFF -s(使用 MS Document Imaging 工具)。

事实证明,与 Windows XP SP2 一起部署的数据执行保护 (DEP) 认为 MODI 是恶意的,并拒绝让它发挥作用。我已经能够通过完全关闭 DEP 来让它工作,但我发现这个解决方案并不优雅。

在不禁用 DEP 的情况下,是否有更好的解决方案来完成这项工作?

0 投票
5 回答
56979 浏览

c# - 带有 Tesseract 界面的 OCR

你如何在 C# 中使用 Tesseract 的界面对 tiff 文件进行 OCR?
目前我只知道如何使用可执行文件来做到这一点。

0 投票
3 回答
7114 浏览

.net - .Net 的条形码和字符识别组件

我需要从图像中提取和解码条形码和文本。是否有任何可用的开源库可以帮助完成该任务?如果没有,你知道一个好的商业产品吗?

0 投票
7 回答
3775 浏览

java - 在 OCR(光学字符识别)之前,您会推荐什么软件用于图像增强?

我们目前正在研究在提交给 OCR 之前提高图像质量的方法。我们目前使用的 OCR 引擎是 Nuance (v15) 的 Scansoft API。我们正在研究领先工具,但后来决定寻找其他地方。与 Lead Tools 相关的许可成本太高了。首先,我们正在寻找简单的图像增强功能,例如:去歪斜、去斑点、去除线条、去除打孔、锐化等。我们正在运行 .NET 和 Java 软件的组合,但首选 Java 解决方案。

0 投票
10 回答
59441 浏览

pdf - Programmatically recognize text from scans in a PDF File

I have a PDF file, which contains data that we need to import into a database. The files seem to be pdf scans of printed alphanumeric text. Looks like 10 pt. Times New Roman.

Are there any tools or components that can will allow me to recognize and parse this text?

0 投票
5 回答
14675 浏览

.net - 市场上可用的开源 OCR 工具

是否有任何用 .NET 编写的开源 OCR 库,或者用任何语言编写但可以在 ASP.NET 应用程序中使用?或者市场上是否有任何开源 OCR API 可用于将图像转换为表格格式?

0 投票
1 回答
1607 浏览

c# - 手机ocr示例代码

我想知道你是否可以给我手机 OCR 中的示例(或片段)代码,因为我需要知道如何开始我的项目。我知道如何编写代码以便在台式电脑上使用,但我的伙伴告诉我,手机有不同的平台。我们计划在这个上使用 .net 移动设备..希望你能帮助我..:)

0 投票
8 回答
43946 浏览

fonts - OCR 的理想字体是什么?

有人对 OCR 的不同字体有任何经验吗?我正在生成一个 ID,然后尝试使用 tesseract 对其进行扫描。目前我只是 T&E'n 不同的字体,但这似乎效率很低。我尝试过 OCR* 系列字体,以及其他各种字体,例如 Arial 和 Georgia。tesseract 容易与 OCR* 字体混淆。

是否有任何专为 tesseract 设计的字体,或任何适用于它的系统字体?

0 投票
7 回答
8024 浏览

ocr - 对可编程驾驶执照扫描仪的建议?

我们的电机池想要扫描驾驶执照并将数据导入我们的自定义系统。我们正在寻找能够让我们以编程方式从扫描仪(包括图片)获取数据并将其插入应用程序的东西。我想知道是否有人对这种类型的系统有经验,可以推荐一个或告诉我们要避免哪些。我们的应用程序是用 PowerBuilder 编写的,并使用 DB2 数据库。

0 投票
8 回答
883 浏览

.net - 从扫描图像中捕获数据的工具

从扫描图像中获取数据的最佳工具有哪些?不管他们是免费的还是付费的。他们应该能够将扫描的图像转换为数据(文本、图像、表格等)。最重要的是,他们应该有 API 与 .NET 2.0 集成以实现自动化。

编辑:输入数据一般是图片中的文本、图片、表格位置。这些图像基本上是来自包含数据的目录的扫描页面。