3

是否有任何关于摩西的 moses.ini 格式的文档?在不带参数的命令行上运行 moses 会返回可用的功能名称,但不会返回它们的可用参数。此外,我可以看到的手册中没有指定 .ini 文件的结构。

4

1 回答 1

1

主要思想是该文件包含将由翻译模型使用的设置。moses.ini因此,应该在 Moses 功能规范中查找值和选项的文档。

以下是我在网上找到的一些关于moses.ini.

Moses Core中,我们有一些细节:

7.6.5 moses.ini
所有特征函数都在本[feature]节中指定。它应该采用以下格式:
* Feature-name key1=value1 key2=value2....
例如,KENLM factor=0 order=3 num-features=1 lazyken=0 path=file.lm.gz

此外,还有关于如何打印 moses.ini 中提到的所有组件的基本统计信息的提示。

运行脚本
analyse_moses_model.pl moses.ini
这对于设置映射步骤的顺序以避免翻译选项的爆炸或仅检查模型组件是否与我们预期的一样大/详细很有用。

计算语言和教育研究中心 (CLEAR) Wiki 中,有一个包含一些文档的示例文件:

参数

建议制作一个.ini文件来存储您的所有设置。

input-factors
- 是否使用因子模型
mapping
- 使用内存中的 LM (T) 或直接读取硬盘中的文件 (G)
ttable-file
- 表示数量。源因素,数量。目标因子的数量、分数的数量和转换表文件的路径
lmodel-file
- 指示用于 LM 的类型(0:SRILM,1:IRSTLM),使用因子编号,LM 的顺序(n-gram)和路径到语言模型文件

如果还不够,本页还有说明,见“解码器配置文件”部分

这些部分 [ttable-file]和分别[lmodel-file]包含指向短语表文件和语言模型文件的指针。您可以忽略这些行上的数字。暂时知道 语言模型规范中的最后一个数字是n-gram模型的顺序就足够了。

配置文件还包含一些特征权重。请注意,该[weight-t]部分有 5 个权重,一个用于短语表中包含的每个特征。

moses.ini训练过程创建的文件未经修改将无法与您的解码器一起使用,因为它依赖于未编译到我们的解码器中的语言模型库。为了使它工作,打开 moses.ini 文件并在[lmodel-file]标题后面的行中找到语言模型规范。该行的第一个数字是0,代表 SRILM。将其更改为8并保持该行的其余部分不变。然后你的配置应该工作。

于 2015-05-12T23:06:00.190 回答