问题标签 [amazon-polly]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
audio - Google Cloud Text-to-Speech Interface Confusion(如何下载 mp3 文件?)
我想以我不是程序员/开发人员的事实作为开头 - 我是一名多媒体设计师。在我们录制官方音频旁白之前,我使用文本转语音生成占位符音频文件,这些文件可用于对动画进行计时。
以前我使用的是 Amazon Polly,但我想尝试一下 Google Cloud。但是,我实际上很难弄清楚如何生成 mp3 文件并保存它们。
使用 Amazon Polly,您只需访问一个网站,在一个字段中输入您的文本,然后单击一个按钮,它就会将您的文件保存为 mp3 文件。使用 Google Cloud,它似乎远比这复杂得多。“快速入门”指南让我启用 API、下载 JSON 文件、设置环境凭据、初始化 SDK 以及在命令提示符中输入代码。
我在他们的文档页面上阅读的每一个指南似乎都不可避免地导致我迈出了我根本不理解的一步。我讨厌听起来像个彻头彻尾的小丑,但这似乎有点过头了。我不想创建软件或将机器学习集成到网站中,我只是想输入几行文本并生成一个 mp3 文件。
有没有办法用谷歌云做到这一点?启动页面 ( https://cloud.google.com/text-to-speech/ ) 提供了我想要的内容,但没有下载文件的选项,只能预览它们。
提前感谢您可以为这个新手提供的任何帮助。
javascript - AWS Polly Javascript 开发工具包“ThrottlingException:超出速率”
我目前正在使用 amazon polly 从数据中生成声音文件,但是当我运行我的脚本时,我不断收到错误消息:
ThrottlingException:超出速率。
我目前拥有的
这是我使用的功能
该函数中的 createAudio 函数是:
我试过了。
我尝试在循环中添加一个setTimeout()
包装器,如下所示:for
但这似乎并没有改变任何东西。我认为正在发生的是所有数据似乎都是一次收集和发送的。
我想要发生的事情。
我想在亚马逊的每个“获取”之间添加一个小延迟以减慢速度。
javascript - AWS Polly 文本到可下载的音频 PCM 文件不起作用
我有一个包含 jquery 和 amazon SDK 的页面。区域框中有用户可以更改的文本。我成功向亚马逊提出请求。我取回 PCM AudioStream (Int16Array)。然后如何将此流转换为可下载的 PCM 文件?文件下载时,文件无用,无法播放。该文件的大小确实大于 0,所以这让我相信那里有数据。
node.js - 使用 Twilio 自动驾驶仪响应的功能
我正在 Twilio 上制作一个自动驾驶助手,但我在通过电话进行文字转语音时遇到了一些问题。出于某种原因,我将控制台中的默认语音设置为 Amazon Polly 的“Joanna”语音,但它一直以我未选择的男性语音接听/拨打电话(我什至不确定它是哪一个!)。
虽然这很糟糕,但我想到了一个可能的解决方案,只需将响应重新路由到 Twilio 运行时函数。
现在的问题是每次助手拨打电话,只要我用“你好”接听电话,它就会挂断。我已经设置了对话流程,所以在接听电话的人先说“你好”之前它什么都不说,反对助手。我对此有点陌生,以前没有广泛使用过 Node.js,所以我想我的功能可能不正确。
这是我所拥有的:
这背后的思考过程很简单,而不是不断出现的男性声音,我现在指定 100% 必须是女性“乔安娜”的声音。所以变量“hello”保存了这些信息并将其用作“say”。
如何使此功能正常工作,以便在我接听电话并以“乔安娜”的声音接听时不只是挂断?
- 另请注意,发生这种情况时,也不会向调试器发送任何内容。
amazon-polly - 跟踪 AWS Polly 演讲的进度
是否有事件或东西可以用来指示当前正在说什么词?
我在文档中找不到任何内容,但我想仔细检查。
我需要这样,例如,可以向后移动 X 个单词。
谢谢
amazon-web-services - 在印度使用 Amazon Lex 构建语音机器人
在他们的网站上,AWS 提到了他们的高质量语音识别和 NLP 以及创建语音机器人的能力。
如果需要使用 AWS Lex 创建语音机器人,但我不需要为呼叫中心创建它,而是从我端拨打电话,即我需要发起呼叫。
我的问题是我应该使用什么服务来拨打电话,因为亚马逊连接在印度不可用。他们是我可以集成 Lex 的服务/产品吗?
amazon-web-services - 将 AWS Polly mp3 文件保存到 S3
我正在尝试向 AWS Polly 发送一些文本以转换为语音,然后将该 mp3 文件保存到 S3。这部分现在似乎起作用了。
我还试图完成其他几件事:
使 mp3 文件可公开访问。目前我必须去 AWS 控制台点击“公开”按钮。'ACL' => 'public-read' 似乎对我不起作用
我需要返回 mp3 文件的完整 URL。出于某种原因 $result_polly['ObjectURL']; 没有任何价值。
我错过了什么?
python - 如何使用 Python 从 Amazon Polly 将文件另存为 mp3
我将 Amazon Polly 用于 TTS,但我无法了解如何将转换后的语音保存到计算机中的 .mp3 文件中
我已经尝试过 gTTS,但我的任务需要 Amazon Polly。
现在,我应该怎么做才能播放这个转换后的语音或将它作为 .mp3 文件保存到我的电脑中?