0

我在使用 Ocropus 4.4 时遇到问题。(开源 OCR)。我按照这个脚本安装了 Ocropus 和必要的库。编译/安装没有任何问题。

但是,在成功安装 ocropus 后,我无法运行任何 ocropus-* 命令。Ocropus-page 和 ocropus-hocr 崩溃而没有给出任何有意义的错误消息。经过 2 分钟的处理后,我只是被神秘地杀死了。

ocropus-pages page_001.jpeg
[note] line recognizer:  >
[note] *** 1 page_001.jpeg ***
Killed

我不知道从哪里开始修复它。有人知道从哪里开始吗?

我的机器是 XUbuntu 10.4 64 位(在 VirtualBox 中运行),基本内存为 512MB。

4

2 回答 2

0

在处理之前,我会尝试将您的图像转换为未压缩的 tiff。我知道 ocropus 与 tesseract 密切合作,并且 tesseract 处理 1bpp 未压缩 tiff 的效果最好。

于 2011-03-16T14:31:04.613 回答
0

尽管这是一个老问题,但我想我会发布一个解决方案/一些调试技巧,因为我在相同的场景下遇到了同样的问题。场景是:Debian 在 512MB RAM 的 VirtualBox 下运行

为了调试“Killed”消息,您应该寻求/var/log帮助。就我而言, kern.log 包含:

debian内核:[89675.791910]内存不足:杀死进程13004(ocropus-rtrain)得分806或牺牲孩子

debian 内核:[89675.791951] 杀死进程 13004 (ocropus-rtrain) total-vm:800816kB, anon-rss:412424kB, file-rss:4kB

您可能需要增加分配给 VM 的资源量,尤其是当您在后台运行一些大型花哨的窗口管理器时!

于 2015-01-27T14:28:41.217 回答