fonts - pdf2htmlEX 的输出仅显示几个字符的 Times New Roman 字体？

Question

我从来没有见过这样的事情。我使用了一个名为的工具pdf2htmlEX，它将 PDF 转换为 HTML，但我遇到了一个奇怪的问题。看这个截图：

看到第一个字符 ( W) 了吗？这是在新罗马时代。现在这是更奇怪的部分：

只有Wand'在 Times New Roman（2 个字形）中，其余的在 Libration Sans 中。这怎么可能？如何pdf2htmlEX为每个字符使用不同的字体？

请注意，如果我在其他任何地方写这些字符，它们都是无衬线字体（文档最初是 Verdana，所以这就是原因）。

任何线索为什么会发生这种情况以及我该如何解决？

score 0 · Accepted Answer

所以我可能已经找到了答案，但老实说，这不是我想要的。

我拥有的 PDF 是在 Microsoft Word 中创建并导出为 PDF，从未使用过字符 W（在这种情况下）。当我在我的文档中随机添加它时，它现在在 HTML 中正常显示。

我有一种感觉 pdf2htmlEX 根据文档中使用的字符编译字体。很奇怪。

不知道我有没有解决这个问题，但现在我至少有一个解释。

1 回答 1