5

我组装了一个快速的 WinForm/嵌入式 IE 浏览器控件,每天早上登录到我们公司的银行网站并抓取/导出所需的存款信息(该银行是一家小型区域银行)。由于我们有几十个从同一个主帐户中提取的“伪帐户”,因此实际上需要 10-15 分钟来检索。

无论如何,唯一的问题是我们的商业银行帐户需要一个 RSA 安全令牌(http://www.rsa.com/node.aspx?id=1156)——如果你不熟悉,它是一个显示每 15(?)秒随机一个 6 位数字,所以我必须在开始之前提示这个值。这是网站基于登录的安全模型之上的,所以即使你创建了一个不能做任何事情的只读帐户,你仍然需要输入 RSA 号码。我们为不同的人提供了 5 个这样的令牌公司。

从我们的角度来看,这是令人讨厌的安全。我开玩笑说要使用网络摄像头对密钥卡中的数字进行 OCR,这样他们就不必输入它——主要是为了在早上有人到达之前完成抓取/导出。好吧,他们问我是否真的可以做到。

所以现在我问你,你认为从相机生成的 JPEG 图像中可靠地对这些数字进行 OCR 需要多难(多少小时)?我已经知道我可以轻松获得 JPEG。我认为您尝试登录 3 次,因此它确实需要达到 99% 的准确率。我可以在空闲时间做这件事,但他们不希望我花几个小时以上的时间,所以我想尽可能多地利用现有代码。这是一个 7 段显示器(如闹钟),因此它不是 OCR 包习惯看到的文本。

还有——显示屏侧面有一个倒数计时器;通常,当它降至 1 格时,您会等到下一个数字出现,然后从 5 格开始(例如手机上的信号强度)。所以这也需要是 OCRd,但它不是文本。

无论如何,我在打字时想得越多,我就越不相信我能真正做到这一点,所以也许我应该在业余时间继续努力?

4

5 回答 5

8

至少有两个文档齐全的开源七段 OCR 程序专为自动读取 RSA SecurID fobs 的任务而设计:

运行在 Symbian 手机上的更多通用软件现在可能已经开放:

帮助视障人士的最新工作似乎是为视障人士实时检测和读取 LED/LCD 显示器- Proc IEEE Workshop Appl Comput Vis。2011

于 2012-01-24T02:35:44.650 回答
6

这实际上比最初看起来要容易。我过去使用过这种技术,因为数字看起来总是一样的,并且总是出现在相同的位置。

只需创建十个小蒙版,每个数字一个,然后准备一个脚本,将您的一个 jpg 图像分成几块,每个数字一个。将相机对齐一次,然后保持原样。现在您有 0-9 的十个掩码,以及设备上的实际数字。将每个掩码中的像素值乘以每个数字,并在每种情况下选择最大值。这将告诉您哪个掩码最适合每个数字,您可以使用它来确定数字。

免责声明:正如其他评论者所指出的那样,出于安全原因,我认为这不是一个好主意。

于 2009-12-31T04:23:14.413 回答
2

我相信有 RSA SecurID 令牌的软件版本。看这里

我不确定它是否适合您的情况(您可能需要与银行交谈),但如果确实如此,它可能比 OCR 更容易和更可靠。

于 2009-12-31T04:49:02.153 回答
1

只是为了微笑,您可以尝试将您的 RSA 令牌扫描输入Tesseract OCR,看看它开箱即用的性能如何。我的猜测是,您需要对扫描对比度/亮度值进行相当大的调整,以获得清晰的文本图像进行扫描。

于 2009-12-31T05:02:30.830 回答
0

您可以尝试在http://www.webservius.com/corp/docs/wisetrend.pdf上使用 OCR API - 对于您正在谈论的卷,它可能对您是免费的。要快速测试是否能识别数字,您可以将测试图像发送至 ocr@wisetrend.com,您将通过电子邮件收到 OCR 结果。

于 2010-03-16T21:07:57.150 回答