1

从右到左的语言(如阿拉伯语)的文本方向如何以 PDF 编码?我的理解是,由于 PDF 基本上是一种图形格式,因此不需要对文本方向的概念进行真正编码。相反,字形只需要在屏幕上从右到左绘制即可。但是,PDF 参考手册提到了一个名为 的属性WritingMode,您可以在其中指定从左到右、从右到左和从上到下、从下到上的组合。

所以我的问题是:

(1) 如果我的理解是正确的,而 RTL 或 LTR 只是通过在屏幕上绘制字形的方式来表达,那么WritingMode属性的意义何在?

(2) 如果 PDF 文件中没有编码的实际方向性信息,除了字形的绘制顺序,PDF-to-Text 程序如何知道给定的行是否应该从右到左读取或左到右?(我想 PDF 程序可以检查从地图中提取的 Unicode 代码点是否ToUnicode落入对应于 RTL 语言的范围内。)

4

2 回答 2

0

如果我正确阅读规范,WritingMode 仅适用于 Tagged PDF。如果 PDF 不包含适当的逻辑结构,则不会得到 WritingMode。

据我了解,一般答案是“视情况而定”。在 RL 写作中,您可能在字体中编码了文本推进信息,并且单个文本位置会将文本推进到正确的位置。我说“可能”是因为实际的生成软件可能会忽略这一点并将每个字形单独放置,而不管字体中的文本是否前进。然后你会得到一些有趣的语言,比如阿拉伯语和希伯来语,它们不是严格意义上的 RL,因为数字在 RL 行中仍然是 LR。

于 2012-02-01T20:52:06.850 回答
0

文本方向将在 Trm 中设置

于 2012-02-02T07:39:45.210 回答