ocr - Google 图书如何查找文本区域？

Question

计算机视觉中的一个具有挑战性的主题是处理文档扫描。通常这涉及到许多步骤，例如去噪、颜色分析、二值化、文本块识别、OCR，然后可能还有一些上下文分析和校正。

我很好奇是否有人理解、知道或可以向我指出关于 Google 如何在 OCR 阶段之前识别文本块的文献。有什么见解吗？

score 2 · Accepted Answer

我相信 Google 将Tesseract OCR引擎与另一个名为Ocropus的工具结合使用，这两个工具都是开源的。我对它们的工作原理一无所知，但您可能有兴趣查看上面链接中提供的代码。

score 0 · Accepted Answer

这是我图书馆的数字化专家提供的二手信息，但 Google 的方法似乎只是将所有内容都通过自动化流程进行处理，对任何看起来像文本的内容进行处理，并且不会对裁剪单个图像或做太多语义大惊小怪analasys 来寻找图像标题等。他们可能正在做一些不明显的微妙事情，但从表面上看，他们肯定是在追求数量而不是质量，这对他们来说是明智的，为了他们的目的，IMO。

ocr - Google 图书如何查找文本区域？

2 回答 2

Related

Reference