giza++ 中的 mkcls 有什么用?
在运行 mkcls 时,giza++ 为源语言和目标语言生成四个文件 *.vcb.classes 和 *.vcb.classes.cats。
*.vcb.classes 的输出是:
. 9
book 10
gave 4
he 3
him 5
i 7
loved 8
read 8
the 2
这些数字代表什么?是单词类数字吗?如果它是一个词类编号,那么它是如何生成的,或者它是如何分类的,基于什么?