我正在使用pdf2htmlEX
将 pdf 转换为 html,当它在 mac 上本地生成时,输出正确显示,但在 amazon linux 上的生产中生成时却不能正确显示。多个页面都有这个问题,但我将使用此pdf的第 22 页作为具体示例。
对于不正确的 html 输出(在 linux 上生成):
- 虽然某些文本在浏览器中呈现时不可见,但在使用 chrome 开发工具检查时,正确的文本在底层 html 中
- 这是由元素的 css
visibility
属性(由类名指定ff13
)设置为引起的hidden
,在正确的转换中它设置为visible
- 我可以在css样式计算选项卡下的开发工具中看到
rendered fonts
正确的字体DejaVu Sans
和不正确的字体Helvetica
我检查并确认DejaVuSans.ttf
(和其他 DejaVu 字体)安装在 linux 机器上/usr/share/fonts/dejavu/
,所以我最好的猜测是由于某种原因pdf2htmlEX
程序在进行转换时找不到字体文件,所以它将 cssvisibility
属性标记为hidden
. 我还尝试安装核心mac(来源此处)和microsoft字体,重新启动机器,然后再试一次,但似乎没有帮助。
有谁知道如何解决这个问题或从这里排除故障?提前感谢您的帮助!