我有一个纯 txt 格式的大图书馆。我需要将这些文件转换为 pdf 格式(从Python 脚本内部,而不是从命令行),但之前我需要对原始文件的文本进行一些操作。我只是将文件的内容读入字符串,进行所需的更改,然后我想将更改后的字符串输出到 pdf 文件中,但不在HDD 上创建临时文本文件。有没有办法做到这一点?
提前致谢。
PS BTW,图书馆是俄语的,所以我想我需要处理编码?
我有一个纯 txt 格式的大图书馆。我需要将这些文件转换为 pdf 格式(从Python 脚本内部,而不是从命令行),但之前我需要对原始文件的文本进行一些操作。我只是将文件的内容读入字符串,进行所需的更改,然后我想将更改后的字符串输出到 pdf 文件中,但不在HDD 上创建临时文本文件。有没有办法做到这一点?
提前致谢。
PS BTW,图书馆是俄语的,所以我想我需要处理编码?
使用 ReportLab 工具包:http ://www.reportlab.com/software/opensource/rl-toolkit/ (它也在 PyPi 上:pip install reportlab;或者如果您正在运行 Linux,请使用包管理器)
PDF 的默认内置字体不支持俄语,因此您必须执行以下操作:
canvas.setFont('DejaVuSans',10)
(将“DejaVuSans”替换为您知道其中包含您的字符的已安装字体名称)。这将在您的 PDF 中包含该字体,并使生成的文件比没有字体大 20K 左右。如果有必要,也可以将 PDF 生成到内存中。