0

我从来没有见过这样的事情。我使用了一个名为 的工具pdf2htmlEX,它将 PDF 转换为 HTML,但我遇到了一个奇怪的问题。看这个截图:

看到第一个字符 ( W) 了吗?这是在新罗马时代。现在这是更奇怪的部分:

只有Wand'在 Times New Roman(2 个字形)中,其余的在 Libration Sans 中。这怎么可能?如何pdf2htmlEX为每个字符使用不同的字体?

请注意,如果我在其他任何地方写这些字符,它们都是无衬线字体(文档最初是 Verdana,所以这就是原因)。

任何线索为什么会发生这种情况以及我该如何解决?

4

1 回答 1

0

所以我可能已经找到了答案,但老实说,这不是我想要的。

我拥有的 PDF 是在 Microsoft Word 中创建并导出为 PDF,从未使用过字符 W(在这种情况下)。当我在我的文档中随机添加它时,它现在在 HTML 中正常显示。

我有一种感觉 pdf2htmlEX 根据文档中使用的字符编译字体。很奇怪。

不知道我有没有解决这个问题,但现在我至少有一个解释。

于 2018-04-05T11:53:28.563 回答