问题标签 [smt-language-processing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
moses - GIZA++ - 如何计算对齐分数?
这可能更像是一个数学问题,但我在其他地方找不到任何相关文档。
我只是想弄清楚在 GIZA++ 中使用哪个方程来计算对齐分数。
可能有人有想法吗?
提前谢谢你的帮助。
machine-translation - 如何在 mgiza++ 或 giza++ 中加速 mkcls 步骤,它占用大量时间进行词聚类?
我正在使用 MGIZA++ 来对齐来自联合国平行语料库的双文字。</p>
在使用 MGIZA++ 训练对齐模型之前,我需要使用mkcls
脚本创建隐马尔可夫模型算法所需的类,如下所示:
我正在用 1,000,000 行的语料库上尝试它,但这需要很长时间并且仍然无法得到结果(当我尝试一个小数据集时,它可以工作)。
是否有用于执行 mkcls 的多线程或并行工具包?