我在我的应用程序中使用 tesseract 库进行图像扫描。我在某处读过该库为超过 100 DPI 的图像提供了良好的性能。我正在使用 iPhone 4 和 iPad 拍摄照片并将其作为 tesseract 库的输入。但仍然库提供不可读的输出。什么是 iPhone 的 DPI 或iPad 相机?如何提高 tesseract 库的性能?
问问题
3627 次
2 回答
4
准备一把 12 英寸的尺子和卷尺。把尺子放在桌子上。将手机放在尺子上方,将相机对准尺子。使用卷尺测量从尺子到相机的距离。给统治者拍照。
在图像查看器或编辑器中打开照片。(例如,您可以在 Mac 上使用预览。)使用图像查看器/编辑器来测量标尺的大小(以像素为单位)。
将标尺的大小(以像素为单位)除以 12。这是标尺图片的每英寸像素(也称为每英寸点数或 DPI),从您用卷尺测量的距离获取。
需要 100 DPI 的关键是 OCR 库需要足够的分辨率来识别字母。它可能希望字母高 15-20 像素(我猜)。如果字母太小,则图像可能没有足够的信息供 OCR 库工作。并且字母也可能太大——库可能没有被编程为寻找 100 像素高的字母。如果字母大小合适,但模糊不清,OCR 库可能无法识别它们。
可能只是因为您尝试拍摄的文字太小,因此当您将相机靠近到足够近以使字母大小合适时,相机无法对焦并且图片模糊。在这种情况下,您可能无法修复它(除了购买配备更好相机的手机)。
于 2012-08-08T08:23:18.747 回答
0
它有 72 dpi,至少这是它存储在 EXIF 中的内容
于 2012-08-08T07:24:43.197 回答