0

我有一个扫描的 PDF 文件,我需要一个 VB.net 源代码,它将扫描的 PDF 转换为文本格式。

4

2 回答 2

2

扫描的文件很可能没有文本而是图像,因此您必须查看 OCR 工具才能获取文本。

有几个 OCR 库,比如

开源 OCR

https://stackoverflow.com/questions/1085/free-ocr-library

于 2009-09-29T08:41:25.227 回答
0

看看http://snipt.org/lOgh/ - 它在 C# 中(在 VB.NET 中应该相对容易重写),并使用可通过 API 访问的托管 OCR 解决方案

于 2010-11-05T23:04:08.183 回答