1

我想将扫描的方格纸笔记本(带手写)的 pdf 格式转换为文本文件。

我怎样才能做到这一点?

谢谢

4

3 回答 3

1

有可以转换类型的 OCR 库(OCRopus、tesseract 等)

还有基于 Java 的手写库。我不确定 OCRopus 是否具有这种能力,我正在研究的一个用于进行手写识别的库是:

在线视频

Java 神经网络

可以想象,您可以获取 pdf,如果需要(根据软件)将其转换为 tiff,它会给您一些东西..

祝你好运!

于 2009-06-20T18:52:38.490 回答
1

查看 OCR 库,例如OCRopus。我认为它不需要 PDF,因此您可能必须先将其转换为 TIFF 或 JPEG。

于 2009-06-20T16:03:38.050 回答
0

如果它是作为 PDF 文件的笔记本,您可以将其通过电子邮件发送到 gmail 帐户,然后 gmail 允许您在浏览器中以 HTML 文件的形式“查看”PDF。页面仍然是图像。

如果您想从中提取文本,OCR 可能会起作用,但也可能无法从中提取文本。

于 2009-06-20T16:20:07.010 回答