card.io - 关于用于字符识别的 card.io 模型的说明

Question

我开始将 card.io 视为 Android 应用程序的一部分，该应用程序应该能够扫描卡并识别卡号、到期日期、持卡人。

挖掘了一段时间后，我找到了 card.io-dmz/models/generated 文件夹，根据开头的评论，我看到了“从模型/conv/...自动生成”的文件。

但是，我无法找到有关用于生成这些“模型”的文件的详细信息。检查代码后，我假设这些生成的文件直接负责卡片中数字的 OCR。

举个例子，下面的卡片被扫描并识别得很好（仅限数字）

浮雕卡

但以下卡失败

非浮雕卡

我尝试在垂直分割完成之前调整 ROI，但我认为两张卡上使用的字体之间的差异使得无法扫描第二张卡。

我的问题是，鉴于当前来自 git hub 的开源项目，是否有人可以添加类似于上面黑色的扫描卡的功能，或者这将需要访问用于执行实际操作的其他资源光学字符识别？

score 2 · Accepted Answer

来自card.io的戴夫在这里。

@Adrian 你的结论都是正确的。

虽然我们很想扩展我们的深度学习字符识别模型以涵盖更新样式的卡片，例如上面的第二张卡片，但这是一项艰巨的任务。

首先需要更新定位卡号的代码，然后训练新的字符识别模型，需要相当多的新型卡片（约 100 张）。

目前，这不适合开源。出于某种原因，人们往往不想分享他们的信用卡图像。

我们已经考虑过创建一个开源应用程序，该应用程序可用于收集卡片图像的某些部分（例如，所有数字位置，加上只有少数数字的实际图像，加上到期日期的图像）。然后也许我们可以众包一个有用的大量信息集合。在构建该集合的同时，我们可以开源我们为使用计算机视觉和深度学习而创建的许多内部工具。

你会参与这样的项目吗？

1 回答 1