0

我正在将 D 驱动器中的 tiff 图像提取为 .hocr 格式并在 D 驱动器中输出。

下面是我的代码

from cgitb import html
from distutils.command.config import config
from PIL import Image
from pytesseract import pytesseract
pytesseract.pytesseract.tesseract_cmd =r'C:\Programs\Tesseract-OCR\tesseract.exe'
pytesseract.run_tesseract('D:\image.tif' ,'output', extension="hocr",lang = None,config="hocr"')

就我而言,代码位于带有输入图像和输出文件夹的 D 驱动器上。

错误:

pytesseract.pytesseract.TesseractError: (1, '错误,无法读取输入文件 D:\image.tif: Invalid argument Error during processing.')

什么地方出了错?我是这个程序的初学者。

我已经用cv2.imshow('sample image',img)它显示的示例 JPG 图像进行了测试。

我试图以不同的方式修改代码,但即使它有错误

from email.mime import image
from statistics import mode
from tkinter import W
from unittest import result
import pytesseract
from PIL import Image
img = image.open("D:/Python_OCR/OCR/Ocr_extract/input/514.png")
print (img)
pytesseract.pytesseract.tesseract_cmd ="C:/Programs/Tesseract-OCR/tesseract.exe"
result = pytesseract.image_to_string(img)
with open("D:/input/image.txt",mode ="W") as file:
file.write(result)

` 错误

file.write(result)
    ^
IndentationError: expected an indented block after 'with' statement on line 11

帮助表示赞赏。

4

0 回答 0