text - 在没有 OCR 的情况下定位和识别矢量图（DXF、SVG、WMF 等）中的文本？

Question

OCR 在我的内容上效果不佳，因为 a) 它是矢量格式，需要从中生成光栅图像，并且在所需的 DPI 下会非常非常大；b) 文本稀疏（分布在大区域），不出现在文本行中，并且经常旋转或镜像。从好的方面来说，文本几乎总是使用一致大小（或少数几个大小）的中心线来描边。

看起来这应该是与手写识别类似的问题，除了它在大坐标空间（即一次不是单个字母或单词）上操作，并且绘图中也有大量非字符数据。

我发现关于这类问题的研究工作很少，甚至更少的代码。是否有我应该查看的代码库或算法？

score 2 · Accepted Answer

2

我会将 CadLib 用于 DXF 和 DWG ( woutware.com )

于 2012-11-20T22:06:15.187 回答

1 回答 1