从右到左的语言(如阿拉伯语)的文本方向如何以 PDF 编码?我的理解是,由于 PDF 基本上是一种图形格式,因此不需要对文本方向的概念进行真正编码。相反,字形只需要在屏幕上从右到左绘制即可。但是,PDF 参考手册提到了一个名为 的属性WritingMode
,您可以在其中指定从左到右、从右到左和从上到下、从下到上的组合。
所以我的问题是:
(1) 如果我的理解是正确的,而 RTL 或 LTR 只是通过在屏幕上绘制字形的方式来表达,那么WritingMode
属性的意义何在?
(2) 如果 PDF 文件中没有编码的实际方向性信息,除了字形的绘制顺序,PDF-to-Text 程序如何知道给定的行是否应该从右到左读取或左到右?(我想 PDF 程序可以检查从地图中提取的 Unicode 代码点是否ToUnicode
落入对应于 RTL 语言的范围内。)