我正在将 D 驱动器中的 tiff 图像提取为 .hocr 格式并在 D 驱动器中输出。
下面是我的代码
from cgitb import html
from distutils.command.config import config
from PIL import Image
from pytesseract import pytesseract
pytesseract.pytesseract.tesseract_cmd =r'C:\Programs\Tesseract-OCR\tesseract.exe'
pytesseract.run_tesseract('D:\image.tif' ,'output', extension="hocr",lang = None,config="hocr"')
就我而言,代码位于带有输入图像和输出文件夹的 D 驱动器上。
错误:
pytesseract.pytesseract.TesseractError: (1, '错误,无法读取输入文件 D:\image.tif: Invalid argument Error during processing.')
什么地方出了错?我是这个程序的初学者。
我已经用cv2.imshow('sample image',img)
它显示的示例 JPG 图像进行了测试。
我试图以不同的方式修改代码,但即使它有错误
from email.mime import image
from statistics import mode
from tkinter import W
from unittest import result
import pytesseract
from PIL import Image
img = image.open("D:/Python_OCR/OCR/Ocr_extract/input/514.png")
print (img)
pytesseract.pytesseract.tesseract_cmd ="C:/Programs/Tesseract-OCR/tesseract.exe"
result = pytesseract.image_to_string(img)
with open("D:/input/image.txt",mode ="W") as file:
file.write(result)
` 错误
file.write(result)
^
IndentationError: expected an indented block after 'with' statement on line 11
帮助表示赞赏。