0
  1. giza++ 中的 mkcls 有什么用?

  2. 在运行 mkcls 时,giza++ 为源语言和目标语言生成四个文件 *.vcb.classes 和 *.vcb.classes.cats。

*.vcb.classes 的输出是:

.      9
book  10
gave   4
he     3
him    5
i      7
loved  8
read   8
the    2

这些数字代表什么?是单词类数字吗?如果它是一个词类编号,那么它是如何生成的,或者它是如何分类的,基于什么?

4

1 回答 1

1

“mkcls”程序将单词分组到等价类中。GIZA++ 使用输出进行字对齐。参见Franz Josef Och,一种确定双语词类的有效方法

于 2014-10-24T12:25:32.363 回答