我想从图像的特定区域提取文本,例如身份证上的姓名和身份证号码。我要从中提取文本的身份证是中文的(中国身份证)。我已经尝试过这段代码,但它只是提取了我不需要的地址和出生日期。我只需要姓名和身份证号码。
import cv2
from PIL import Image
import pytesseract
import argparse
import os
image = cv2.imread("E:/face.jpg")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
filename = "{}.png".format(os.getpid())
cv2.imwrite(filename,gray)
text = pytesseract.image_to_string(Image.open(filename), lang='chi_sim')
print(text)
os.remove(filename)