我正在编写一个脚本来使用文本到语音阅读 PDF,但 PyPDF2 无法阅读阿拉伯语 PDF。
import pyttsx3
import PyPDF2
book = open('mine.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(book)
pages = pdfReader.numPages
wholeText = ' '
for i in range(6, 10):
page = pdfReader.getPage(i)
text = page.extractText()
wholeText = wholeText + text
print(wholeText)