我使用文档数据库,每个内容包含 5 到 20 页的文本数据。
我有三个任务:
- 将多语言输出为 PDF 文档。UTF8 格式的文本,可能包含英语、法语、德语、俄语等内容以及翻译等组合。
- 在 PDF 中添加自动排版,这意味着 Unicode 字符的字距调整和替换组合。
- 我的工作有 MinionPro-xxx.otf(10 ligatures)字体。
我尝试使用 Wayne Munro (pdf@ros.co.nz) 的 PHP Cphf 库,并在其中添加了很多正则表达式。我已经添加了很多 PDF 文本格式操作符,就像Ts, TL, T*, Tc, Tw, Tz
我几乎完成了,但是我无法访问 Type 1 字符表之外的字符的字形,我不知道如何从中获取“kern”和“hmtx”表字体文件?如何嵌入字形?
我相信,我可以通过矩阵变换 PDF 文本指令进行字距调整:
[ (A) 120 (W) 120 (A) 95 (Y again) ] TJ
UPD#1: MinionPro 字体没有“kern”表。它有“GPOS”(字形定位表),我非常接近解决这个问题。顺便说一句,通过 PHP 走进二进制文件是一场噩梦((