我正在使用 matplotlib 生成 PDF 图形。然而,即使是最简单的数字也会产生相对较大的文件,下面的 MWE 会产生近 1 MB 的文件。我已经意识到大文件大小是由于 matplotlib 完全嵌入了所有使用的字体。由于我要制作很多图并想减小文件大小,所以我想知道:
主要问题:
有没有办法让 matplotlib 嵌入字体子集而不是完整的字体?我也可以完全不包括字体。
到目前为止考虑的事情:
- 矢量图形编辑器可以很容易地用于导出包含字体子集(以及根本不包括字体)的 PDF,但是必须为每个文件(修订)执行此步骤似乎不必要地乏味。
- 同样,我读过有关后处理 PDF 文件(例如使用 Ghostscript)的信息,尽管努力似乎相当。
- 我尝试设置'pdf.fonttype'= 3,这确实会产生相当小的文件。但是,我想在矢量图形编辑器中保留可修改的文本 - 在这种情况下似乎不起作用(例如,减号不会保存为文本)。
由于使用外部软件生成带有嵌入子集的文件很容易,尽管很费力,是否有可能直接在 matplotlib 中实现这一点?任何帮助将不胜感激。
MWE
import matplotlib.pyplot as plt #Setup
import matplotlib as mpl
mpl.rcParams['pdf.fonttype'] = 42
mpl.rcParams['mathtext.fontset'] = 'dejavuserif'
mpl.rc('font',family='Arial',size=12)
fig,ax=plt.subplots(figsize=(2,2)) #Create a figure containing some text
ax.semilogy(1,1,'s',label='Text\n$M_\mathrm{ath}$')
ax.legend()
fig.tight_layout()
fig.savefig('test.pdf')
环境:matplotlib 3.1.1