opencv - 提高低质量扫描图像的 OCR 质量

Question

自动纠偏和裁剪后，我有以下图像：

我需要对这张图片进行 OCR。现在 ABBYY Engine SDK 11 For Linux 产生的结果不是很好：

IMerasers - www,raiyirnieti'^C9,co;i,ni                                                          
Clariiis: Jv ocl'ca :PO 9ox 30998, S&M Luke C6y, UT 84":30                                       
Guslomei: Service:                                 952-945-800G or 800-952-3^55                  
Jieaf5ftg: impaired;                               VA                                            
Pharmaaisto:                                       853-364-6331                                  
Medica Pfovic.&s:                                  80 ;j-2i5S-55"',2 o ■ www.rfledica.cori       
^ofricai'or Services:                              86i-7<5-9920                                  
t1 ^edHoaiihca'Q Provicors; 6 77-842420 or                                                       
                                               ; mffiffiF********                               
Sviet iea Be tsvio a rieofift:                                                                  
Mocica Ca-linK frwso ,'ne: 430-962-9*9?

可以将哪些自动图像预处理技术应用于此图像以提高 OCR 质量？或者无法提高此图像的 OCR 质量？现在我使用 OpenCV 和 Leptonica 库来预处理图像。

更新

这是原图：

score 2 · Accepted Answer

图像已以相对较低的分辨率和噪声进行二值化。

您可以通过以下方式稍微改进它

将分辨率增加一倍或三倍（有或没有双线性插值，差别不大）；
平滑（小高斯滤波器，中值...）；
再次二值化。

但是您几乎无法恢复，损害已经造成。最有可能的是，预处理会使结果恶化。

score 0 · Accepted Answer

正如 Yves 所说，图像的质量非常低。尽管如此，您应该能够改善您的结果：

尝试调整图像大小。一些 OCR 需要特定尺寸的字母
尝试使用其他 OCR，例如 tesseract
如果您必须阅读许多具有相同字体的文档，您可以使用该字体训练 OCR

opencv - 提高低质量扫描图像的 OCR 质量

2 回答 2

Related

Reference