0

不确定这是否是询问或 doctype 的合适位置,但无论如何我都会问......一直在与德国客户合作,这个非常奇怪的问题开始出现......

因此,在为网站填充内容时,我从他们的 pdf 表中复制/粘贴到我的编辑器 (Espresso) 中。奇怪的是,虽然所有文本在编辑器上看起来都很原始,但在浏览器中打开后,我们开始发现带有重音字符的异常异常,被向前推进。所以一个 ' ' 显示为 O" ,依此类推。

我认为这是一些 unicode 问题,但该站点被声明为 utf8 ,并且没有输入富文本或任何内容,它只是来自编辑器的原始文本。所以这真的令人难以置信。如果客户端直接编辑文件,它会正确显示。我发现如果我手动输入和替换重音字符,也很好。

任何人都有类似的经验/解决方案?

我应该不应该有本地化/字体问题,因为这些本质上是拉丁字符?(如我错了请纠正我)

4

1 回答 1

3

您不能可靠地从 PDF 中剪切和粘贴。内部格式并不像看起来那样。:-)

PDF 可能会在内部使用特殊编码以使打印的页面看起来正确,但这并不意味着您可以复制粘贴。

这是一个有一点背景的 StackExchange 问题:https ://tex.stackexchange.com/questions/22213/how-to-get-accented-unicode-characters-that-c​​an-be-copy-pasted 。

虽然这与您的问题不太一样,但它确实表明您如何制作 PDF 确实很重要。有可能某些 Latin-1(重音)字符在 PDF 中被编码为不是具有预期 Unicode 代码点的字符,而是具有使字符正确显示的绘图指令。

也许这个产品可以帮助你。我没有使用它,所以不能推荐它,但是稍微搜索一下可能会产生一些你可以使用的东西。(这个声称支持德语。)

于 2011-09-01T07:02:19.103 回答