我有一个扫描的 PDF 文件,我需要一个 VB.net 源代码,它将扫描的 PDF 转换为文本格式。
问问题
9952 次
2 回答
2
扫描的文件很可能没有文本而是图像,因此您必须查看 OCR 工具才能获取文本。
有几个 OCR 库,比如
于 2009-09-29T08:41:25.227 回答
0
看看http://snipt.org/lOgh/ - 它在 C# 中(在 VB.NET 中应该相对容易重写),并使用可通过 API 访问的托管 OCR 解决方案
于 2010-11-05T23:04:08.183 回答