所以我试图使用 abby cloud ocr 从发票中提取数据。我得到了xml文件的输出现在我想做的是寻找一个文本并获取它的矩形坐标然后寻找最近的矩形并获取它的值我需要矩形坐标很好xml文件实际上返回坐标但是我无法理解
将向您展示 xml 输出的示例(将不需要的文本替换为“....”)
<line baseline="2062" l="2037" t="2033" r="2206" b="2064">....</line>
<line baseline="2101" l="295" t="2070" r="588" b="2097">....</line>
无论如何,这些矩形太不同了,我去看了文档,这就是所说的
baseline — the distance from the base line to the top edge of the page
l — the coordinate of the left border of the surrounding rectangle,
t — the coordinate of the top border of the surrounding rectangle
r — the coordinate of the right border of the surrounding rectangle
b — the coordinate of the bottom border of the surrounding rectangle
周围矩形左边框的坐标是什么意思?
这种格式的矩形坐标不是 [[x1,y1],[x2,y2],[x3,y3],[x4,y4]]?
你能向我解释一下这些坐标是什么意思吗?或者我该如何使用它??