我正在使用 python-tesseract 从图像中提取单词。这是一个 tesseract 的 Python 包装器,它是一个 OCR 代码。
我正在使用以下代码来获取单词:
import tesseract
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)
mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result
这仅返回图像中的单词而不是它们的位置/大小/方向(或换句话说,包含它们的边界框)。我想知道是否有任何方法可以得到它