1

OCR 在我的内容上效果不佳,因为 a) 它是矢量格式,需要从中生成光栅图像,并且在所需的 DPI 下会非常非常大;b) 文本稀疏(分布在大区域),不出现在文本行中,并且经常旋转或镜像。从好的方面来说,文本几乎总是使用一致大小(或少数几个大小)的中心线来描边。

看起来这应该是与手写识别类似的问题,除了它在大坐标空间(即一次不是单个字母或单词)上操作,并且绘图中也有大量非字符数据。

我发现关于这类问题的研究工作很少,甚至更少的代码。是否有我应该查看的代码库或算法?

4

1 回答 1

2

我会将 CadLib 用于 DXF 和 DWG ( woutware.com )

于 2012-11-20T22:06:15.187 回答