由于您可能不明白的原因,您的 PDF 有点困难。
它的核心问题是文档中的一些图形实际上是使用自定义字形绘制的。如果从 Acrobat 中复制并粘贴文本,您会看到这一点。那里有各种不寻常的角色,似乎没有任何用处。那就是 SVG 底部的那些方块,里面有 EE 和 FF。
然而,这些字符实际上是页面底部矩阵周围的大括号之类的自定义字形。因此,它们对于本文档都非常重要且非常具体。
我尝试使用 ABCpdf .NET 将您的 PDF 转换为 SVG。除了底部的这些自定义字形之外,它工作得很好。输出约为 90KB。它看起来与您的 inkscape SVG 输出非常相似,但稍小一些(inkscape 的 160KB)。
摆脱这些非 Unicode 字形的唯一方法是矢量化文本。我使用 ABCpdf 做到了这一点,并且输出在 SVG 中看起来很好。但是...矢量化文本很大,而 SVG 并不是一种特别有效的媒介。输出约为 1MB!将其压缩到一半,但仍远不及原始 PDF 的效率。
无论您使用什么格式,我在这里看到的问题都是通用的。无论您输出到 SVG、SWF、HTML 画布、VML 还是任何矢量格式,这些自定义字符总是会出现问题。
那我会建议什么?那么在网络上广泛使用的明显矢量格式是...... PDF!
我知道这不是您正在寻找的,但我认为这是考虑到上述限制的现实解决方案。:-)