0

我是一名自由作家,收集了大量需要转录的采访材料。

在浏览 Internet 时,我遇到了 IBM Watson “Speech to text”,它应该是处理大量口语的理想解决方案。

注册后,我什至无法打开它。因为我不是很擅长编程等。

有人可以提供一个示例,说明我可以遵循哪些步骤来完成我的任务?

4

3 回答 3

0

如果您不是编码员,那么对您来说最好的起点是 Node-RED。看看这个创建翻译器的教程 - https://developer.ibm.com/tutorials/build-universal-translator-nodered-watson-ai-services/?cm_mmc=IBMDev- -Digest- -ENews2019-_-电子邮件&spMailingID=39408813&spUserID=MzYzODEwODAwNzk4S0&spJobID=1500992192&spReportId=MTUwMDk5MjE5MgS2

如果使用 Speech to Text、Translation 和 Text to Speech。您只需要 Speech to Text 位。一旦你让它与麦克风一起工作,你就可以利用文件注入来通过服务推送你自己的音频文件。

对于较大的文件,您将需要使用 http post 和 multi-parts,当您达到这一点时,提出一个新问题,用 node-red 标记它,然后有人会为您发布示例流程。

于 2019-05-07T09:30:07.823 回答
0

您无需具备任何编程知识即可使用 Watson Speech To Text。您可以使用该curl工具将文件发送到服务。您可以轻松地将其安装在您的计算机中,它是免费的。

然后,您可以将文件发送到运行以下命令的服务:

curl -X POST -u "apikey:{apikey}" --header "Content-Type: audio/flac" --data-binary @audio-file2.flac "https://stream.watsonplatform.net/speech-to-text/api/v1/recognize"

您只需要一个 apikey 即可运行该命令,您可以按照以下步骤获取:https ://cloud.ibm.com/docs/services/watson?topic=watson-iam

.flac然后只需将该命令中的文件替换为您要处理的文件即可。Content-Type:并为标题传递正确的值。对于 Flac 文件audio/flac,对于其他音频格式,您可以在此处查看列表:https ://cloud.ibm.com/apidocs/speech-to-text

于 2019-05-08T02:19:46.430 回答
0

你想在哪个平台上使用 Speech to text 服务呢?

于 2019-05-06T07:37:08.313 回答