词汇表名称是设置对象的成员,是 start_transcription_job 方法的参数。
参考:https ://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job
例子:
settings = {
'VocabularyName': 'your-custom-vocabulary-name-goes-here'
}
client_transcribe.start_transcription_job(
TranscriptionJobName=job_name,
LanguageCode='your-language-code-goes-here',
Settings=settings,
MediaFormat='mp4',
OutputBucketName=bucket
Media={
'MediaFileUri': file_url
})
如果您需要帮助来确定词汇表的语言代码,如果您安装了 AWS cli,则可以从终端使用以下 AWS cli 命令:
aws transcribe get-vocabulary --vocabulary-name {your-custom-vocabulary-name}
它返回一个响应,例如:
{
"LastModifiedTime": 1573523589.419,
"VocabularyName": "redacted",
"DownloadUri": "redacted",
"LanguageCode": "en-US",
"VocabularyState": "READY"
}
例如,如果您的词汇表的语言代码是en-US
,那么在调用 时使用该语言代码start_transcription_job
。
希望这可以帮助!