ibm-watson - 如何开始实际的“语音转文字”？

Question

我是一名自由作家，收集了大量需要转录的采访材料。

在浏览 Internet 时，我遇到了 IBM Watson “Speech to text”，它应该是处理大量口语的理想解决方案。

注册后，我什至无法打开它。因为我不是很擅长编程等。

有人可以提供一个示例，说明我可以遵循哪些步骤来完成我的任务？

score 0 · Accepted Answer

如果您不是编码员，那么对您来说最好的起点是 Node-RED。看看这个创建翻译器的教程 - https://developer.ibm.com/tutorials/build-universal-translator-nodered-watson-ai-services/?cm_mmc=IBMDev- -Digest- -ENews2019-_-电子邮件&spMailingID=39408813&spUserID=MzYzODEwODAwNzk4S0&spJobID=1500992192&spReportId=MTUwMDk5MjE5MgS2

如果使用 Speech to Text、Translation 和 Text to Speech。您只需要 Speech to Text 位。一旦你让它与麦克风一起工作，你就可以利用文件注入来通过服务推送你自己的音频文件。

对于较大的文件，您将需要使用 http post 和 multi-parts，当您达到这一点时，提出一个新问题，用 node-red 标记它，然后有人会为您发布示例流程。

score 0 · Accepted Answer

您无需具备任何编程知识即可使用 Watson Speech To Text。您可以使用该curl工具将文件发送到服务。您可以轻松地将其安装在您的计算机中，它是免费的。

然后，您可以将文件发送到运行以下命令的服务：

curl -X POST -u "apikey:{apikey}" --header "Content-Type: audio/flac" --data-binary @audio-file2.flac "https://stream.watsonplatform.net/speech-to-text/api/v1/recognize"

您只需要一个 apikey 即可运行该命令，您可以按照以下步骤获取：https ://cloud.ibm.com/docs/services/watson?topic=watson-iam

.flac然后只需将该命令中的文件替换为您要处理的文件即可。Content-Type:并为标题传递正确的值。对于 Flac 文件audio/flac，对于其他音频格式，您可以在此处查看列表：https ://cloud.ibm.com/apidocs/speech-to-text

score 0 · Accepted Answer

0

你想在哪个平台上使用 Speech to text 服务呢？

于 2019-05-06T07:37:08.313 回答

ibm-watson - 如何开始实际的“语音转文字”？

3 回答 3

Related

Reference