如果您向下滚动此页面,您会看到英国英语的连字符模式,例如:
\patterns{ % just type <return> if you're not using INITEX
.ab4i
.ab3ol
.ace4
.acet3
.ach4
.ac5tiva
这些像 .ab4i 这样的模式是什么意思?
如果您向下滚动此页面,您会看到英国英语的连字符模式,例如:
\patterns{ % just type <return> if you're not using INITEX
.ab4i
.ab3ol
.ace4
.acet3
.ach4
.ac5tiva
这些像 .ab4i 这样的模式是什么意思?
TeX 连字符模式中有三种字符。点.
是单词边界的锚点。一个字母代表它自己,也就是要连字的单词中的一个字母。数字代表潜在的断字点,数字表示断字级别。总共有五个级别。
该算法的基本思想是将单词与模式匹配,并从每个匹配的模式中插入连字级别。如果来自两个不同模式的两个级别在同一点匹配,则选择较高的级别。在最终值中,只有奇数级别表示允许的断字点。这个想法是能够指定可能的连字符点和不应插入连字符的位置。因此,例如,如果单词中的特定位置与该位置具有 1 和 2 的两个模式匹配,则不允许在该位置使用断字,因为 2 会覆盖 1,并且只有奇数值表示允许的断字点。
查看您的示例,.ab4i
表明abi
在单词的开头很少会收到和之间的连字符b
,i
因为 4 的级别是偶数,除非被 5 覆盖,否则会禁止连字符。另一方面,以开头的单词activa
总是可以在 thec
和 the之间连字,t
因为 5 将覆盖任何其他值,并且奇怪的是,允许连字。
这些模式是使用名为patgen2
. 在patgen2.tutorial上有关于这个工具的教程的 TeX 源代码,关于这个主题的博士论文可以通过tug.org 获得。