对于大小为 5+ MB 的图像,我收到了来自 tesseract 的错误。
Tesseract Open Source OCR Engine v3.01 with Leptonica Page 0 图像太大:(39667, 56133) 处理过程中出错。
文件大小是否有限制或是否有解决此问题的参数。
感谢你的帮助..
最大宽度和高度为 32767。
从源代码(文件 baseapi.cpp):
if (tesseract_->ImageWidth() > MAX_INT16 ||
tesseract_->ImageHeight() > MAX_INT16) {
tprintf("Image too large: (%d, %d)\n",
tesseract_->ImageWidth(), tesseract_->ImageHeight());
超出 Tesseract 限制的不是文件大小,而是图像大小(尺寸)。我对 Tesseract 识别 16MB 图像没有任何问题。尝试调整图像大小或重新缩放图像,然后重试。