问题标签 [smt-language-processing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
853 浏览

moses - GIZA++ - 如何计算对齐分数?

这可能更像是一个数学问题,但我在其他地方找不到任何相关文档。

我只是想弄清楚在 GIZA++ 中使用哪个方程来计算对齐分数。

可能有人有想法吗?

提前谢谢你的帮助。

0 投票
0 回答
212 浏览

machine-translation - 如何在 mgiza++ 或 giza++ 中加速 mkcls 步骤,它占用大量时间进行词聚类?

我正在使用 MGIZA++ 来对齐来自联合国平行语料库的双文字。</p>

在使用 MGIZA++ 训练对齐模型之前,我需要使用mkcls脚本创建隐马尔可夫模型算法所需的类,如下所示:

我正在用 1,000,000 行的语料库上尝试它,但这需要很长时间并且仍然无法得到结果(当我尝试一个小数据集时,它可以工作)。

是否有用于执行 mkcls 的多线程或并行工具包?