我通过重写 Tesseract 的源代码(我使用 SVN 597)解决了这个问题。正如 nguyenq 所说,Tesseract 尝试在 TESSDATA_PREFIX 环境变量设置的路径中查找数据。如果找不到,那么它会做一些我不明白的诡计:)。因此,如果有人需要 Tesseract 的便携版本(不依赖于 Tesseract 安装),请在第 60 行附近编辑 mainblk.cpp,这是我的版本:
// remove the stuff that Tesseract does to find the installation path
/* if (!getenv("TESSDATA_PREFIX")) {
#ifdef TESSDATA_PREFIX
#define _STR(a) #a
#define _XSTR(a) _STR(a)
datadir = _XSTR(TESSDATA_PREFIX);
#undef _XSTR
#undef _STR
#else
if (argv0 != NULL) {
if (getpath(argv0, dll_module_name, datadir) < 0)
#ifdef __UNIX__
CANTOPENFILE.error("main", ABORT, "%s to get path", argv0);
#else
NO_PATH.error("main", DBG, NULL);
#endif
} else {
datadir = "./";
}
#endif
} else {
datadir = getenv("TESSDATA_PREFIX");
}*/
datadir = "./"; // look for config things in the same folder as the executable.
现在你可以在“tesseract 可执行位置”\tessdata 目录中打包东西了