ocr - 为什么 DPI 与相机为 OCR 拍摄的图像相关

Question

我目前正在从事一个涉及使用 Tess4j Tesseract OCR 引擎的项目。在从事这个项目的过程中，我访问了很多网站，这些网站声称 Tesseract 在至少 300 DPI（每英寸点数）的图像上效果最好。

我的问题是为什么 DPI 被多次提到图像。我了解，当您扫描对象时，您希望以至少 300 DPI 进行扫描。我只是不明白为什么这与用相机拍摄的照片有关。据我所知，DPI 是打印机的属性。基于此属性，它越高，图像越小，但质量越高。

现在，如果 DPI 与这些图像无关，那么我想知道为什么当我在 72 和 300 之间更改图像的 DPI 属性时程序的结果会有所不同。是否有我不知道的 Tesseract 预处理？

score 5 · Accepted Answer

实际上，它是特定 DPI 下的文本大小。

有最小文本大小吗？（它不会读取屏幕文本！）

为了合理的准确性，有一个最小的文本大小。您必须考虑分辨率和点大小。精度下降到 10pt x 300dpi 以下，迅速低于 8pt x 300dpi。快速检查是计算字符 x 高度的像素。（X 高度是小写 x 的高度。）在 10pt x 300dpi 时，x 高度通常约为 20 像素，尽管这可能因字体而异。x 高度低于 10 像素，您几乎不可能获得准确的结果，低于大约 8 像素，大部分文本将被“去除噪点”。

https://github.com/tesseract-ocr/tesseract/wiki/FAQ#is-there-a-minimum-text-size-it-wont-read-screen-text

ocr - 为什么 DPI 与相机为 OCR 拍摄的图像相关

1 回答 1

Related

Reference