正如标题所说的那样。
严格来说,我定义为灰度图像的“文本”边界框是一组 4 个坐标(x、y、x+width、y+height),它们必须在该图像中定义一个矩形区域,该区域具有最大数量非白色像素,同时尽可能少的白色像素(不改变非白色像素的最大数量)。我有引号中的文本,因为图像实际上不包含文本,因为图像只包含带颜色的像素。
在我的 Ubuntu 中安装 ImageMagick 并在终端中输入命令:$convert input.png -trim ouput.png
,我得到:
在 Web 浏览器的新选项卡中打开这两个图像,您将了解它们之间的区别,您还将了解我定义为“文本”边界框的内容。output.png 实际上具有我正在寻找的宽度和高度。我不知道如何获取 x 和 y 坐标。
此处为pdf页面提供的答案 (1)不符合我的标准,因为gs给我的“文本”边界框有很大的白边距(实际上据我所知,gs定义为“文本”边界框pdf 与我对图片的“文本”边界框的定义不同)。