我从来没有见过这样的事情。我使用了一个名为 的工具pdf2htmlEX
,它将 PDF 转换为 HTML,但我遇到了一个奇怪的问题。看这个截图:
看到第一个字符 ( W
) 了吗?这是在新罗马时代。现在这是更奇怪的部分:
只有W
and'
在 Times New Roman(2 个字形)中,其余的在 Libration Sans 中。这怎么可能?如何pdf2htmlEX
为每个字符使用不同的字体?
请注意,如果我在其他任何地方写这些字符,它们都是无衬线字体(文档最初是 Verdana,所以这就是原因)。
任何线索为什么会发生这种情况以及我该如何解决?