我试图弄清楚如何使用 Leptonica 库提供的分段器进行文档分析。我一直在看pageseg.c,但我认为我并不完全理解它:(!
如果我拍摄图像并将其作为 PIX 数据类型加载,我是否调用 pixGetRegionsBinary() 来查找每个符号的位置?然后我是否使用文本块掩码分别提取每个符号?
如果我理解正确,我会有这样的代码:
Pix* page = pixRead("myImage.tif");
Pix** halftone;
Pix** textline;
Pix** textblock;
if ( pixGetRegionsBinary( page, halftone, textline, textblock, 0 ) )
{
//..error message
}
现在是文本块中的所有字符还是我使用了错误的分割方法:)?另外我怎么知道文本块“数组”何时结束?
提前致谢!!
编辑 26/11/2013
对于任何感兴趣的人 - Leptonica Doxygen 文档 - 页面分割是整页分割的一个很好的例子!