我的问题的背景与免费的 OCR 引擎 Tesseract 相关(1985-1995 年由 HP 提供,现在托管在 Google 中)。它特别需要一个输入文件和一个输出文件;该参数只接受文件名(不是流/二进制字符串),因此为了使用包装器 API,例如 pytesser 和/或 python-tesser.py,必须创建 OCR 临时文件。但是,我有很多图像需要 OCR;频繁的磁盘写入和删除是不可避免的(当然也会影响性能)。我能想到的唯一选择是更改包装类并将临时文件指向 RAM 磁盘,这会带来这个问题。
如果您有更好的解决方案,请告诉我。
非常感谢。
-M