我正在尝试在 python 中处理 tesseract 来做简单的工作: - 打开图片 - 运行 ocr - 获取字符串 - 获取字符坐标
最后一个是我的痛!
这是我的第一个代码:
import tesseract
import glob
import cv2
api = tesseract.TessBaseAPI()
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZéèô%")
api.SetPageSegMode(tesseract.PSM_AUTO)
imagepath = "C:\\Project\\Bob\\"
imagePathList = glob.glob(imagepath + "*.jpg")
for image in imagePathList:
mBuffer=open(imagePathList[10],"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
img = cv2.imread(image)
cv2.putText(img,result,(20,20), cv2.FONT_HERSHEY_PLAIN, 1.0,(0,255,0))
cv2.imshow("Original",img)
cv2.waitKey()
由于我的图片有不同的布局,不同的位置有不同的单词,我想为每个字符设置一个框。
我见过谈论: - api.getBoxText - Hocr
但是没有找到在 Python 中实现它的方法。