0

我有一个 lambda,当有人将音频文件上传到存储桶时,它会被触发。我需要使用AWS Transcribe异步处理文件。我编写了代码来做到这一点,但问题是它只检查一次,而不是在文件处理完成后调用处理函数。

下面是 AWS transcribe 的stackoverflow链接,但我们必须等待 thr 响应,直到作业完成并且 lambda 函数超时 5 分钟。之后执行将停止。

// 创建异步客户端对象以调用 AWS Transcribe

private AmazonTranscribeAsync asyncClient = AmazonTranscribeAsyncClientBuilder.standard().build();

// 下面是使用上传的音频文件调用 AWS API 的方法

private void startText(String guid, String bucket) {
    String jobName = UUID.randomUUID().toString();
    StartTranscriptionJobRequest request = new StartTranscriptionJobRequest();
    request.withLanguageCode(LanguageCode.EnUS);

    Settings channel_settings = new Settings();
    channel_settings.setChannelIdentification(true);
    channel_settings.withChannelIdentification(true);

    Media media = new Media();
    media.setMediaFileUri(s3.getUrl(bucket, guid).toString());
    request.withMedia(media);
    request.setTranscriptionJobName(jobName);
    request.withMediaFormat(getFileFormat(guid));
    request.withSettings(channel_settings);
    asyncClient.startTranscriptionJobAsync(request, new AsyncTranscriptionJobHandler());
}

// 异步处理方法

private class AsyncTranscriptionJobHandler implements AsyncHandler<StartTranscriptionJobRequest, StartTranscriptionJobResult>
{
    public void onError(Exception e) {
        System.out.println(e.getMessage());
        System.exit(1);
    }

    @Override
    public void onSuccess(StartTranscriptionJobRequest request, StartTranscriptionJobResult result) {
        logger.log(result.getTranscriptionJob().getTranscriptionJobName());
        TranscriptionJob transcriptionJob = result.getTranscriptionJob(); 
        if (transcriptionJob.getTranscriptionJobStatus().equals(TranscriptionJobStatus.COMPLETED.name())) {
            logger.log("completed");
        } else if(transcriptionJob.getTranscriptionJobStatus().equals(TranscriptionJobStatus.FAILED.name())) {
            logger.log("failed");
        } else if(transcriptionJob.getTranscriptionJobStatus().equals(TranscriptionJobStatus.IN_PROGRESS.name())) {
            logger.log("processing");
        }

    }
}
4

1 回答 1

1

这里的技巧是不要等待转录完成,而是在一个 lambda 中调用它,然后在转录完成后触发一个单独的 lambda。

AWS Transcribe 使用 CloudWatch Events 来通知作业何时完成或失败 ( https://docs.aws.amazon.com/transcribe/latest/dg/cloud-watch-events.html ),这是 lambda 支持的事件源 ( https ://docs.aws.amazon.com/lambda/latest/dg/invoking-lambda-function.html#supported-event-source-cloudwatch-events

于 2018-10-31T09:32:34.750 回答