4

计算机视觉中的一个具有挑战性的主题是处理文档扫描。通常这涉及到许多步骤,例如去噪、颜色分析、二值化、文本块识别、OCR,然后可能还有一些上下文分析和校正。

我很好奇是否有人理解、知道或可以向我指出关于 Google 如何在 OCR 阶段之前识别文本块的文献。有什么见解吗?

4

2 回答 2

2

我相信 Google 将Tesseract OCR引擎与另一个名为Ocropus的工具结合使用,这两个工具都是开源的。我对它们的工作原理一无所知,但您可能有兴趣查看上面链接中提供的代码。

于 2009-05-25T00:44:39.923 回答
0

这是我图书馆的数字化专家提供的二手信息,但 Google 的方法似乎只是将所有内容都通过自动化流程进行处理,对任何看起来像文本的内容进行处理,并且不会对裁剪单个图像或做太多语义大惊小怪analasys 来寻找图像标题等。他们可能正在做一些不明显的微妙事情,但从表面上看,他们肯定是在追求数量而不是质量,这对他们来说是明智的,为了他们的目的,IMO。

于 2009-01-15T05:33:29.473 回答