问题标签 [amazon-polly]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ios - Swift AWSPolly 中的错误处理
我能找到的每个 AWSPolly 示例都说: // 同样,我们忽略了示例中的错误。
我无法弄清楚如何处理错误。如果 Internet 服务中断并且无法访问 Polly,该怎么办。我想使用内部声音。但我想不通。
我检查了:awsTask.isCanceled || awsTask.isFaulted
但是,如果 Internet 服务不可用,它们都不是真的。
amazon-web-services - 如何管理数百个 AWS IAM 角色?
我们有 3 个存储桶和许多文件夹。
目前有 3 个角色来管理这些存储桶,因此可以保持访问级别。
客户希望限制仅提供对某些特定文件夹的访问权限。
如果我们为特定文件夹创建多个角色,我们最终将拥有 100 个不同的角色。
Hashi Corp Vault 将使用这些 IAM 角色来提供访问权限。
是否有更好的方式来管理和扩展 AWS IAM 角色?
是否有关于如何管理多个角色的指南?
aws-sdk - Amazon AWS Polly 忽略 VoiceId - Javascript 开发工具包
我已经集成了我的 Javascript AWS SDK,并在没有服务器的情况下向 API 发送了一个请求。一切正常,但问题是,端点“忽略”了 VoiceId。
问题:端点总是返回带有 VoiceID 'Ivy' 的 mp3。
voice
例如,我发送Justin
JS
python - “Polly”对象没有属性“start_speech_synthesis_task”
我正在尝试StartSpeechSynthesisTask
通过以下代码使用 AWS Polly:
但是,它会引发此错误:
“Polly”对象没有属性“start_speech_synthesis_task”
boto3.Session(...).client(...)
我也用同样的错误实例化了客户端。
我尝试更新 boto3 无济于事。AWS 论坛中的类似帖子似乎没有得到答复。
我怎样才能解决这个问题?
提前致谢!
amazon-polly - 带有 Amazon Polly 的 SSML 标签的情感 TTS
Polly 允许使用很棒的 SSML 标签,但我似乎找不到可以添加某种情感的标签。让我们将其称为情感 TTS。例如,以下代码段:
有没有可能和波莉一起做情感 TTS?例如波莉的“aaaws”和“aaahs”?我想如果是的话,它必须通过 SSML。正确的?我将如何修改上述内容以促进这样的事情?
node.js - 如何将 Amazon polly TTS 和语音标记添加到 MAYA 中构建的 3D 模型中?
我们有一个 Web 应用程序,它使用 Three.js 在浏览器中加载 3D 模型(在 MAYA 中构建)。我需要添加以下内容,
- 使用 Amazon Polly 的文本转语音。
- 从 Amazon Polly 获取语音标记,然后3D 模型需要使用Amazon Polly 中提供的语音标记和耳语功能。
我已经搜索过它并找到了https://aws.amazon.com/sumerian/features/。在 Amazon sumerian 中,我们有一个名为 Sumerian Hosts 的功能,但它具有预定义的模型。
所以我的问题是,是否可以使用 Amazon Polly 将 TTS 与语音标记集成,以便在 MAYA 中使用 Three.js 在 nodejs 中构建 Web 应用程序构建 3D 模型。
amazon-web-services - AWS Polly 不支持的特殊字符
我们正在使用 AWS polly 服务进行文本转语音。我们使用文本类型作为 SSML。但是我们发现在我们想要转换的文本中有一些 AWS Polly 不支持的字符。例如,不支持字符“&”。
我可以获取 Polly 不支持的字符列表吗?如果有人知道这对我真的很有帮助。
谢谢你。
speech-recognition - 使用 Amazon Polly Text to Speech 从音频文件中模仿真实语音波形的语调
我想使用 Amazon Polly 生成听起来非常逼真的语音 - 比允许 Amazon Polly 从正常文本输入生成语音音频输出所产生的结果更真实。为了做到这一点,我想告诉 Polly 尽最大努力精确匹配由配音演员配音/录制的真实语音音频文件输入的给定样本。换句话说,我想将配音演员产生的有声语音转换为适合作为 polly api 输入的某种代码(例如音素、时间代码等)序列,然后可以生成音频文件输出应尽可能模仿原始记录的输入。
某些 AWS api 是否将语音音频文件作为输入,并将其转换为一系列代码(例如音素和时间信息),然后可以将其输入 polly api 以生成相应的语音?如果没有,是否还有其他适合用于第一步的 api?
为什么?使用 Polly 以“正常方式”创建语音——通过将文本输入 polly api——往往会产生听起来不够自然的语音(尽管它可能是目前可用的最好的文本到语音引擎)。Polly API 语音产生的“正常方式”没有正确的时间/韵律。我们尝试手动将语音逐字转换为音素并手动添加计时信息,然后将其作为输入输入 Polly API,但这既非常费力,也不会产生非常令人满意的结果。我们已经在应用程序中使用了它。对于演讲中特别重要的部分,我们需要得到更好的质量。我们不能像在其他情况下那样使用配音演员录制的音频,因为那样它就不会匹配由 Polly API 生成的其余语音。
顺便说一句,在你投票反对这篇文章之前,因为它不包含一点代码片段......考虑这仍然是一个编码问题,只是不是以“帮助我编辑我的代码片段来做 x”的形式 - 虽然如果存在这样的答案,则代码片段答案将是该问题答案的一种很好的形式!这实际上是一个广泛重要且普遍的编码问题,可能会影响任何需要通过代码创建逼真语音的编码器。
谢谢
wordpress - WordPress Amazon Polly S3 权限
我有一个 WordPress 网站,并且正在使用 Amazon Polly 插件。发布帖子后,它会将音频文件直接保存在 Amazon AWS S3 存储桶中。这一切都很顺利。
我还使用服务器级别的用户/密码锁定了该网站,以便只有少数有权访问该材料的人才能访问该网站。
我的问题是:Amazon S3 存储桶应该具有哪些权限?这是否仍然可以公开访问?还是我把它收紧?请参阅下面的推荐内容。
注意:一个警告是,我希望 S3 文件 URL 也可供我选择的少数几个作为文本下载链接访问。
编辑公共访问设置 选定存储桶的公共访问设置 使用 Amazon S3 阻止公共访问设置强制存储桶不允许公共访问数据。您还可以在账户级别配置 Amazon S3 阻止公共访问设置。
管理选定存储桶的公共访问控制列表 (ACL) 阻止新的公共 ACL 和上传公共对象(推荐)删除通过公共 ACL 授予的公共访问权限(推荐)管理所选存储桶的公共存储桶策略 阻止新的公共存储桶策略(推荐)阻止公共和桶有公共策略的跨账户访问(推荐)
json - 类型错误:不是 JSON 可序列化的
我正在尝试使用 Python 创建一个AWS Lambda函数,该函数应从某个 API 接收文本并返回一个包含 JSON 的AudioStream
对象。为此,我正在使用AWS Polly。目前我可以AudioStream
在我的机器上从 AWS 获取它,它工作正常。
为了使用 AWS Polly,我创建了一个特殊用户并授予他AmazonPollyReadOnlyAccess
访问AmazonPollyFullAccess
权限。
但是,当我尝试使用此代码片段以 JSON 格式返回响应时,我收到了错误消息。
我该如何正确地做到这一点?