我有包含应该替换文本的 PDF 文件。更具体地说,应该翻译文本并用翻译版本替换。重要的是 PDF 结构的其余部分保持不变。请注意,文本在 PDF 中可用,不需要像 OCr 之类的技术。此外,如果保留字体和其他文本属性会很好。
您会推荐哪些库来将文本提取为易于编辑的格式(例如 CSV)并重新放入新文本?
我有包含应该替换文本的 PDF 文件。更具体地说,应该翻译文本并用翻译版本替换。重要的是 PDF 结构的其余部分保持不变。请注意,文本在 PDF 中可用,不需要像 OCr 之类的技术。此外,如果保留字体和其他文本属性会很好。
您会推荐哪些库来将文本提取为易于编辑的格式(例如 CSV)并重新放入新文本?
假设您用不同的语言替换文本,在大多数情况下您将不得不选择不同的字体,而且字体选择很重要。我已经使用Foxit库成功地更改了文本或创建了 PDF。