1

我正在使用pdf2htmlEX将 pdf 转换为 html,当它在 mac 上本地生成时,输出正确显示,但在 amazon linux 上的生产中生成时却不能正确显示。多个页面都有这个问题,但我将使用此pdf的第 22 页作为具体示例。

对于不正确的 html 输出(在 linux 上生成):

  1. 虽然某些文本在浏览器中呈现时不可见,但在使用 chrome 开发工具检查时,正确的文本在底层 html 中
  2. 这是由元素的 cssvisibility属性(由类名指定ff13)设置为引起的hidden,在正确的转换中它设置为visible
  3. 我可以在css样式计算选项卡下的开发工具中看到rendered fonts正确的字体DejaVu Sans和不正确的字体Helvetica

我检查并确认DejaVuSans.ttf(和其他 DejaVu 字体)安装在 linux 机器上/usr/share/fonts/dejavu/,所以我最好的猜测是由于某种原因pdf2htmlEX程序在进行转换时找不到字体文件,所以它将 cssvisibility属性标记为hidden. 我还尝试安装核心mac(来源此处)和microsoft字体,重新启动机器,然后再试一次,但似乎没有帮助。

有谁知道如何解决这个问题或从这里排除故障?提前感谢您的帮助!

4

1 回答 1

0

您需要确保所有未嵌入 PDF 字体的字体文件都在 fontconfig 路径中​​。您可以在 fontconfig 配置文件(通常是 /etc/fonts/fonts.config)中看到路径列表。查看此文件的顶部以获取目录列表。如果您的字体文件不在其中之一中,则将找不到它。

在您的情况下,我会将字体文件移动到 /usr/share/fonts 而不是子目录中。

于 2020-03-08T12:42:50.600 回答