google-cloud-automl - Google Translate v3 API 中的词汇表

Question

通过 Google translate_v3beta1 API 对词汇表的支持究竟应该如何工作？我一直在寻找这个信息，但没有找到。词汇表中的术语是否应该简单地覆盖所有其他潜在翻译，或者它们只是为词汇表中的翻译添加优先级，但如果根据训练数据“更适合”引擎仍然可以使用其他翻译？

我已经使用 Python 库创建了一个词汇表（我尝试了两种不同的方法——从 tsv 使用“language_pair”属性以及从 csv 使用“language_codes_set”属性）。然后我尝试使用词汇表覆盖自定义 MT 模型生成的文本字符串中一个术语的翻译（即，不使用词汇表，引擎以一种方式翻译一个术语，我尝试使用词汇表强制它对该术语使用另一种翻译），但没有成功。

现在我不确定，如果我在创建或使用词汇表时犯了一些错误（目前我不知道我的代码中有任何问题），或者我这边没有错误，但是根据训练数据引擎只是使用了另一种翻译。根据我使用其他自定义机器翻译平台的经验，我知道其中一些使用词汇表来覆盖翻译，而其中一些仅使用它们来确定词汇表术语的优先级，而不是完全覆盖所有其他潜在的翻译。因此，在开始寻找其他可能的原因之前，我想先澄清这个简单的问题，为什么我的代码不能按预期工作。

先感谢您。

score 2 · Accepted Answer

好的，所以我在其他地方得到了答案。词汇表的翻译应覆盖模型使用的术语。它对我不起作用还有另一个原因（我使用了不正确的响应字段 - “翻译”而不是“glossaryTranslation”）。

根据 Suresh 在评论中的要求进行编辑：

有关与上述问题相关的 Google API 响应的详细信息，请参见此处，使用 Python 客户端库时请参见此处。

使用Python 客户端库的代码示例片段：

response = client.translate_text(
    contents = [source_text],
    parent = parent,
    mime_type = 'text/html',
    source_language_code = source_language,
    target_language_code = target_language,
    model = model_id,
    glossary_config = glossary_config,
    timeout = 90
)
google_translation = response.glossary_translations[0].translated_text # Here "glossary_translations" must be used instead of "translations", if you use glossary.

google-cloud-automl - Google Translate v3 API 中的词汇表

1 回答 1

Related

Reference