-1

我想知道,我们如何将字体转换为 Unicode 字体。我有我的母语的 PDF 文件,但这些文本是用特定的字体文件(ttf 文件)编写的。所以我想将这些文本转换为 Unicode 字体。

那么如何将这些文本转换为 Unicode。是否有任何免费的在线软件可用,或者我必须用任何语言编写任何软件代码。

我在 PHP 中尝试过,但没有变得更有效。

4

1 回答 1

3

您的问题混合了几个基本概念(尚不清楚您是要转换字体还是要转换它所用的文本),我建议您在问“那我该怎么做”之前对字体技术进行更深入的研究。

“普通”字体使用Unicode 编码。字体的“编码”描述了字体内的哪个字符图像对于给定的字符代码得到输出。一种字体可以包含多种编码——MacRoman、Windows Western——现在包括 Unicode 编码实际上是标准的。

如果不将其字符集转换为 Unicode,则无法使用不符合 Unicode 编码(或任何常见编码)的字体。

您的描述表明您的 PDF 中的字体可能是一种不合格的字体,因此您需要一个将其字符代码映射到 Unicode 值的表。使用谷歌查看是否有人在您之前这样做;如果没有,您将不得不自己创建表。

然而

由于您的文本来自 PDF,因此您不能再依赖编码!如果创建了 PDF,则执行此操作的软件可以自由地将字符移动到不同的位置——通常它会从原始字体创建子集字体,并且可以方便地重新分配字符代码。友好的 PDF 创建者也可以在 PDF 中包含他们自己的编码,但这不是强制性的。如果它丢失,并且您的字体被子集化,那么只有一个解决方案:您必须 为该特定 PDF创建一个翻译表。它对使用“相同”字体的其他文档没有任何用处,因为它很可能会有不同的子集。

于 2013-09-09T14:11:27.250 回答