0

如何映射/标准化COCO边界框坐标以匹配使用的pdfminerbbox 坐标?

COCO的 BBox 是左上 x,左上 y,宽度,高度,而pdfminer' 的 BBox 是左下 x,左下 y,右上 x,右上 y。

我可以使用简单的规则从 COCO 提供的信息中获取左下角和右上角的坐标,例如:

bottom_left_x = top_left_x
bottom_left_y = top_left_y - height
top_right_x = top_left_x + width
top_right_y = top_left_y

但不幸的是,它没有给出预期的输出,可能是由于两个表示中的参考点(原点)不同。

4

0 回答 0