41

我想构建一个 Android 应用程序,它应该通过 OCR 库扫描图片并从中提取文本。

我应该使用什么 Java 库?

4

4 回答 4

21

不知道它有多好(肯定需要先训练),但是有Ron Cemer 的 Java OCR library

于 2009-12-10T03:47:30.203 回答
7

如果您正在寻找一个非常可扩展的选项或有一个特定的问题域,您可以考虑使用Java Object Oriented Neural Engine自行开发。

我在个人项目中成功地使用了它来识别来自这样的图像的字母您可以在 github 上找到我的应用程序的 OCR 组件的所有源代码,here

于 2009-06-30T09:23:34.387 回答
6

试试 tesseract,看看这篇文章 http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html 和这个例子 http://code.google.com/p/mezzofanti/

编辑:更多事实 - tesseract 是谷歌使用的最好的开源 OCR 之一 - 有许多语言的训练数据 - mezzofanti 是一个使用 tesseract 的 android 应用程序 - 注意:OCR 确实使用了大量的 CPU 能力。尝试使用您的 T-Mob G1 对 A4 页面进行 OCR 将花费大量时间,而且结果可能不会给您留下深刻印象;-)

于 2011-02-14T11:21:05.723 回答
0

您可以使用 Google Docs 中的 OCR 功能。检查文档列表数据 API http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR

于 2011-05-25T16:15:46.327 回答