我目前正在从事一个个人项目,用于解码图像中的文本或任何对象。
我正在使用GD
库来处理图像。我可以访问图像的每个像素及其 rgb 颜色。
我的问题不是关于编码,我只是在寻找一种算法来解码图像,或者任何关于如何做到这一点的建议,我不想使用任何 API,我想自己做。我知道php有一个人脸检测库,但它只识别图像中的人脸,我不知道它是如何做到的。
首先,我假设对象是白色的,背景是黑色的(或任何单独的颜色)。
摘要:如何为 php 程序定义一个对象或一个词并训练它从图片中识别它?
您尝试实现的过程称为“光学字符识别”,并且有一些可用的免费软件可以执行此操作。使用此表达式,您可能会找到更多信息。
您没有指定您正在寻找的软件组件类型,因此很难更具体。
这通常是一个容易出错的过程,但如果您可以对输入做出规律性假设,您可能会得到更好的结果,特别是如果您已经知道输入中使用了哪些字符类型。
有用的起点可能是
http://jwilk.net/software/ocrodjvu http://unpaper.berlios.de/
如果您可以选择转换为 DJVU 并在 UNIX 系统上使用 python,您可以考虑将第一个链接作为解决方案。否则,您可以使用 ocrodjvu 支持的各种工具来开始您的研究。第二个是更多关于您可能希望在 OCR 之前进行的预处理,但如果您想实现自己的过程仍然可能有用。