我正在尝试在 Microsoft Hub 中训练引擎,同时利用显着更好的神经与 SMT 技术。在https://translator.microsoft.com/neural/上进行测试时,我很清楚 Neural 是我想要的。
但是,//hub.microsofttranslator.com/Help/Download/Microsoft%20Translator%20Hub%20User%20Guide.pdf 上的集线器文档令人困惑:
在第 7 页,第 2.3.1 段它说
该类别为您的项目标识了领域——您要使用的术语的一般领域。请选择与您的文件类型最合适且最相关的类别。
在某些情况下,您选择的类别会直接影响 Hub 的行为:
- 如果您选择“技术”并选择使用 Microsoft 模型,则 Hub 将使用一组与所有其他类别不同的基础模型。
- 如果您选择“语音”,Hub 将使用经过优化的模型来处理语音识别系统的输出。
- 任何其他类别选择都使用“通用”Microsoft 模型,并用作类别 ID 中的标识符。
但是在第 51 页,它完全与该声明相矛盾,并说:
问:我在创建项目时选择了“技术”类别。当我为这个项目训练系统并选中“使用微软模型”选项时,训练会使用微软的技术模型吗?
答:不会。此时“使用 Microsoft 模型”的选择总是调用通用训练数据,与 Bing Translator 相同。类别选择仅用于确定您的目的,但到目前为止,对培训或翻译期间的行为没有影响。这将在即将发布的版本中改变。
有人可以解决这个问题吗?我必须选择什么样的类别和“使用 MS 模型”选项才能获得我正在寻找的“良好”神经 MT 输出?
谢谢!
@Chris_Wendt 最近在另一篇文章中写道:
在 API 调用中使用参数 &category=generalnn 将产生与您在 Bing UI 中看到的结果相同的结果。小心标记的内容。使用默认类别值(空白或“常规”)可以更好地处理标签。
我正在为 Microsoft 翻译器使用 SDL Trados 2017 插件。我有办法传递这个参数吗?
[