我目前正在做一个项目,我需要在多字体大小的图像上检测粗体文本(所以不可能有数学形态学)。此检测将与 OCR 系统(使用 tesseract)并行使用,以检测文档中哪些信息(粗体)是重要的。
我已经测试了 tesseract 的 wordFontAttribute() 函数,但它不一致:它为我提供了粗体检测的糟糕结果并降低了我的 OCR 系统的性能,因为要使用此函数,需要旧版本的 tesseract (v3)。
我发现了一些基于字体样式检测的科学研究,例如粗体检测(“文档图像中斜体,粗体和全大写单词的自动检测”和“多字体文档中粗体字的脚本独立检测” “在谷歌学者上)。
我想知道是否有在线研究的代码实现。
也欢迎任何其他关于大胆检测的想法