这是来自 Tesseract 4 输出(.hocr 文件)的行:
<span class='ocr_line'
id='line_1_1'
title="bbox 36 92 580 122; baseline 0 -6; x_size 30; x_descenders 6; x_ascenders 6">
x_descenders
和x_ascenders
属性是什么意思?
我知道在排版中,下降是“延伸到字体基线以下的字母部分”。但是在某些情况下 x_descenders 不是整数而是浮点数,例如 in x_descenders 5.2608695
。那这意味着什么?
然后我想知道如何解释小数部分