1

我希望能够识别我正在阅读的纯文本(无图像)书籍的哪一页......最好的方法是什么:

我最初在考虑某种图像匹配,但所有教科书的页面看起来如此相似,不知道这会有多好?

第二个想法是使用 OCR?

任何想法或建议...谢谢!

4

1 回答 1

2

我认为图像匹配在你的情况下真的没用......如果你想检测你在哪一页上并且这本书有编号的页面,你可以使用像 Tesseract 这样的 OCR。

  • 1)找到页码(左上角,右下角..)
  • 2)提取它(提取图像以继续对其进行解码)
  • (2bis)预处理图像...)
  • 3) 对其进行解码(使用 Tesseract 或其他 OCR)

如果您不想使用 OCR,您可以查看 Hu Moments,如果数字是标准印刷数字,它可以很好地识别它们。

于 2011-08-11T06:06:34.037 回答