通过 Google translate_v3beta1 API 对词汇表的支持究竟应该如何工作?我一直在寻找这个信息,但没有找到。词汇表中的术语是否应该简单地覆盖所有其他潜在翻译,或者它们只是为词汇表中的翻译添加优先级,但如果根据训练数据“更适合”引擎仍然可以使用其他翻译?
我已经使用 Python 库创建了一个词汇表(我尝试了两种不同的方法——从 tsv 使用“language_pair”属性以及从 csv 使用“language_codes_set”属性)。然后我尝试使用词汇表覆盖自定义 MT 模型生成的文本字符串中一个术语的翻译(即,不使用词汇表,引擎以一种方式翻译一个术语,我尝试使用词汇表强制它对该术语使用另一种翻译),但没有成功。
现在我不确定,如果我在创建或使用词汇表时犯了一些错误(目前我不知道我的代码中有任何问题),或者我这边没有错误,但是根据训练数据引擎只是使用了另一种翻译。根据我使用其他自定义机器翻译平台的经验,我知道其中一些使用词汇表来覆盖翻译,而其中一些仅使用它们来确定词汇表术语的优先级,而不是完全覆盖所有其他潜在的翻译。因此,在开始寻找其他可能的原因之前,我想先澄清这个简单的问题,为什么我的代码不能按预期工作。
先感谢您。