1

我正在尝试在 Microsoft Hub 中训练引擎,同时利用显着更好的神经与 SMT 技术。在https://translator.microsoft.com/neural/上进行测试时,我很清楚 Neural 是我想要的。

但是,//hub.microsofttranslator.com/Help/Download/Microsoft%20Translator%20Hub%20User%20Guide.pdf 上的集线器文档令人困惑:

在第 7 页,第 2.3.1 段它说

该类别为您的项目标识了领域——您要使用的术语的一般领域。请选择与您的文件类型最合适且最相关的类别。

在某些情况下,您选择的类别会直接影响 Hub 的行为:

  • 如果您选择“技术”并选择使用 Microsoft 模型,则 Hub 将使用一组与所有其他类别不同的​​基础模型。
  • 如果您选择“语音”,Hub 将使用经过优化的模型来处理语音识别系统的输出。
  • 任何其他类别选择都使用“通用”Microsoft 模型,并用作类别 ID 中的标识符。

但是在第 51 页,它完全与该声明相矛盾,并说:

问:我在创建项目时选择了“技术”类别。当我为这个项目训练系统并选中“使用微软模型”选项时,训练会使用微软的技术模型吗?

答:不会。此时“使用 Microsoft 模型”的选择总是调用通用训练数据,与 Bing Translator 相同。类别选择仅用于确定您的目的,但到目前为止,对培训或翻译期间的行为没有影响。这将在即将发布的版本中改变。

有人可以解决这个问题吗?我必须选择什么样的类别和“使用 MS 模型”选项才能获得我正在寻找的“良好”神经 MT 输出?

谢谢!

@Chris_Wendt 最近在另一篇文章中写道:

在 API 调用中使用参数 &category=generalnn 将产生与您在 Bing UI 中看到的结果相同的结果。小心标记的内容。使用默认类别值(空白或“常规”)可以更好地处理标签。

我正在为 Microsoft 翻译器使用 SDL Trados 2017 插件。我有办法传递这个参数吗?

[插件的样子]

4

2 回答 2

1

您可以在 Trados 的类别 ID 字段中传递“generalnn”或 Hub 自定义系统的 ID,或任何其他允许您设置类别值的 TM 工具。神经系统此时不可定制,但您可以像使用定制系统一样使用它。

于 2017-08-22T22:31:54.613 回答
0

神经系统现在可以使用自定义翻译器的新预览进行自定义。您需要使用Microsoft Translator Text API v3和自定义翻译支持NMT 语言的语言对。

于 2018-05-08T18:26:40.107 回答