我正在开发一个简单的应用程序,它将帮助我将所有包含英文文本的 pdf 文件转换为 pdf 的法文文本。我研究了一个简单的概念证明,它可以帮助我遍历给定的文件并将所有文本转换为法语。现在我坚持将转换后的法语文本保存为具有与原始英文版本相似结构的 pdf。
import PyPDF2
from googletrans import Translator
translator = Translator()
read_pdf = PyPDF2.PdfFileReader(open('any_english.pdf', 'rb'))
write_pdf = PyPDF2.PdfFileWriter()
number_of_pages = read_pdf.getNumPages()
for i in range(number_of_pages):
page = read_pdf.getPage(i)
page_content = page.extractText()
print translator.translate(page_content, dest='fr').text
// Save the converted version text in french into a pdf conserving structure as original pdf
**笔记
pdf中的所有内容都是文本格式而不是图像。