0
$:~/mgizapp/scripts$ ./plain2snt-hasvcb.py
Error, the input should be 
./plain2snt-hasvcb.py evcb fvcb etxt ftxt esnt(out) fsnt(out) evcbx(out) fvcbx(out)
You should concatenate the evcbx and fvcbx to existing vcb files

有人可以解释一下plain2snt 脚本的所有acran 输入吗?该脚本来自http://geek.kyloo.net/software/doku.php/mgiza:forcealignment的用于单词对齐的 mgiza++ 程序

evcb = ? #是source.vcb文件吗?fvcb = ? #是target.vcb文件吗?

esnt(out) = ? fsnt(出)=?

evcbx(出) = ? fvcbx (输出) = ?

回答

我设法让它工作

$mkcls -n10 -psourcelangfile.vcb -Vsourcelangfile.vcb.classes
$mkcls -n10 -psourcelangfile.vcb -Vtargetlangfile.vcb.classes
$plain2snt sourcelangfile targetlangfile
$snt2cooc sourcelang_targetlang.cooc sourcelangfile.vcb targetlangfile.vcb sourcelangfile_targetlangfile.snt
4

1 回答 1

2

根据我对 GIZA++ 的(非同等)经验以及您链接到的页面,我会说 evcb 和 fvcb 是您已经生成的“英语”和“外国”词汇文件,而 etxt 和 ftxt 是“英语”和“外国”文本输入。似乎 esnt 和 fsnt 是“英语”和“外国”句子输出文件(可能是用 vcb 文件中的唯一标识符替换单词的句子)。最后,evcbx 和 fvcbx 似乎是通过连接扩展原始词汇文件的输出位置。

我希望这会有所帮助,如果我错了,我希望其他使用过 MGIZA 的人可以加入并纠正我。

于 2011-05-09T19:56:45.320 回答