如何映射/标准化COCO
边界框坐标以匹配使用的pdfminer
bbox 坐标?
COCO
的 BBox 是左上 x,左上 y,宽度,高度,而pdfminer
' 的 BBox 是左下 x,左下 y,右上 x,右上 y。
我可以使用简单的规则从 COCO 提供的信息中获取左下角和右上角的坐标,例如:
bottom_left_x = top_left_x
bottom_left_y = top_left_y - height
top_right_x = top_left_x + width
top_right_y = top_left_y
但不幸的是,它没有给出预期的输出,可能是由于两个表示中的参考点(原点)不同。