2

我目前正在从事一个涉及使用 Tess4j Tesseract OCR 引擎的项目。在从事这个项目的过程中,我访问了很多网站,这些网站声称 Tesseract 在至少 300 DPI(每英寸点数)的图像上效果最好。

我的问题是为什么 DPI 被多次提到图像。我了解,当您扫描对象时,您希望以至少 300 DPI 进行扫描。我只是不明白为什么这与用相机拍摄的照片有关。据我所知,DPI 是打印机的属性。基于此属性,它越高,图像越小,但质量越高。

现在,如果 DPI 与这些图像无关,那么我想知道为什么当我在 72 和 300 之间更改图像的 DPI 属性时程序的结果会有所不同。是否有我不知道的 Tesseract 预处理?

4

1 回答 1

5

实际上,它是特定 DPI 下的文本大小。

有最小文本大小吗?(它不会读取屏幕文本!)

为了合理的准确性,有一个最小的文本大小。您必须考虑分辨率和点大小。精度下降到 10pt x 300dpi 以下,迅速低于 8pt x 300dpi。快速检查是计算字符 x 高度的像素。(X 高度是小写 x 的高度。)在 10pt x 300dpi 时,x 高度通常约为 20 像素,尽管这可能因字体而异。x 高度低于 10 像素,您几乎不可能获得准确的结果,低于大约 8 像素,大部分文本将被“去除噪点”。

https://github.com/tesseract-ocr/tesseract/wiki/FAQ#is-there-a-minimum-text-size-it-wont-read-screen-text

于 2017-04-13T14:50:55.483 回答