问题标签 [ssml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
text-to-speech - 如何在使用 SSML 说话时跳过部分文本
是否有一些 SSML 标签等,以从说话中删除特定的文本行。是的,我知道我可以使用字符串函数将其删除,然后再将其发送到语音合成器。但我的问题是,有没有办法标记或标记某些文本,使其无法播放。我正在为这个问题寻找一些基于 XML 的解决方案。
vxml - VoiceXML 提示和 SSML元素。如何从指定位置读取提示?
<mark> 元素通知阅读继续进行。但是有没有办法让我们从 mark (name) id 返回的指定位置再次读取提示?
在这种情况下它可能很有用:我们正在阅读一个长文本。然后用户命令:暂停。我们停下来。然后用户会说“继续”。我们从最后一个位置继续阅读提示。
这有可能吗?
我还要问另一个问题。无论是否使用 SSML:如何使其工作 - 暂停提示阅读,然后从我们停止的位置继续?暂停的意思是“完全控制那个暂停”,这样我们就可以随时继续。动态地。
android - 为 Android TTS 引擎指定发音的最佳实践?
总的来说,我对 Android 的默认文本转语音引擎(即 com.svox.pico)印象深刻。正如预期的那样,它会误读一些单词(就像我一样),因此偶尔需要一些发音指导。因此,我想知道以语音方式拼出 pico TTS 引擎错误发音的那些单词的最佳实践。
例如,恰恰拉卡鸟的正确发音是 CHAH-chah-LAH-kah。以下是 TTS 引擎产生的内容:
这是我的问题。
- 是否有 Android TTS 引擎识别的标准拼音?
- 如果没有,是否有一些用于制作自定义发音拼写的一般规则,使拼写在未来的 TTS 引擎/版本中更有可能是正确的?
- Android TTS 引擎似乎忽略了文本大小写。指定重点的最佳方式是什么?
顺便说一句,这是 TTS 引擎写入 logcat 的内容:
V/TtsService(294): TTS 处理: CHAH chah LOCKah
V/TtsService(294): TtsService.setLanguage(eng, USA, )
I/SVOX Pico Engine(294): 语言已经加载 (en-US == en-US )
I/SynthProxy(294):将语速设置为 100
I/SynthProxy(294):将音调设置为 100
[更新]
我尝试将 XML 文档传递给 TextToSpeech.speak(),如下所示:
正如Android Eve 所建议的那样,TTS 引擎只读取XML 正文(即关于大型汽车和庞大银行账户的评论)。我没有意识到 TTS 引擎能够解析 XML 文档。但是,我在 TTS 输出中没有听到任何强调。
[更新 2]
我在这里将问题简化为 Android TTS 是否支持语音合成标记语言。
android - Android TTS 是否支持语音合成标记语言?
将以下 SSML(语音合成标记语言)文档传递给 com.svox.pico TextToSpeech 引擎会读取 XML 正文,但无法从音素元素或强调元素进行控制。这个结果(没有明显的 SSML 控制)在运行 Android 2.2 的 Nexus One 以及运行 SDK 级别 8 的 AVD 的模拟器上是相同的。
是否有任何 Android TTS 引擎支持任何 SSML 元素?
android - Android 的 TTS XML 中音素属性的正确语法是什么?
我的理解是,这个X-SAMPA XML 样本,就像这里的其他样本,甚至这里和这里的样本一样,应该听起来有点意思。
然而,出于某种奇怪的原因,它什么也没说(完全沉默)。
我错过了什么?
澄清一下:我的 TTS 示例应用程序设置正常:如果我在该标记.
之前将其更改为任何单词,Android TTS 只会说该单词正常。我唯一的问题是我无法以任何方式使用。</speak>
<phoneme alphabet=\"xsampa\" ph=\"faIv\"/>
我知道 a.
应该是静音的,但是根据这些样本的海报,它应该发出 XML 中的 XSAMPA 音素。我错过了什么?
attributes - ssml 中的 vxml 元素
我只是在 tropo 的 ssml 文件中使用 vxml 元素。tropo 无法识别
解释 =“时间”,我必须输入解释 =“vxml:时间”。
但我还需要定义格式属性格式:“hms12”。所以我写这个:
<say-as interpret-as="vxml:time" format="hms12">243P</say-as> </s>
但它一直像三个整数一样发音。
我到处搜索正确的语法,但找不到任何东西。
ios - textToSpeech 时如何在段落后暂停
我有一个用于 textToSpeech 的文本。
我想暂停从适用于 iPhone 的 Dragon 移动 SDK 读取的文本。文本没有 SSML。只有空白文本。
我可以使用什么样的字符来暂停?我知道在一个“.”之后是一个暂停,我试着做两个。像 ”。 。” 但不起作用。
我怎样才能在段落之后暂停?
例子:
ios - 如何使用 SSML 减慢文本到语音的速度 - 语音声音失真/扭曲/可怕
我正在使用适用于 iPhone 的nuance dragon mobile sdk,用于使用文本到语音。
阅读的文本有点快,我想让它变慢,这样用户就可以学习单词。我的目标是放慢文本的速度。这与 SSML 和韵律标签配合得很好,请参阅以下代码:
声音听起来扭曲、扭曲和可怕。
你明白我的意思吗?
我该怎么做才能获得清晰的声音但说话缓慢的文字?
c# - C# SAPI 可以说 SSML 字符串吗?
我在我的 C# WPF 项目中实现了一个 TTS。
以前,我使用 System.Speech.Synthesis 命名空间中的 TTS 说话。讲话内容为 SSML 格式(Speech Synthesizer Markup Language,支持自定义语速、语音、强调),如下所示:
但不幸的是,System.Speech.Synthesis TTS 存在内存泄漏问题,正如我在 .Net Speech.Synthesizer 中的内存泄漏问题中提到的那样?.
所以我决定使用 SAPI COM 组件。我可以轻松地让 SAPI 说出纯文本内容。但后来我继续尝试让它说 SSML 字符串,我失败了。代码如下:
代码的重要部分是
它使用SpeechVoiceSpeakFlags 枚举来指定 TTS 说话行为。我尝试了几种标志组合,但没有一个能成功说出 SSML 内容。
特别是,上面的代码还会引发以下异常:
System.Runtime.InteropServices.COMException 未处理
Message="Exception from HRESULT: 0x80045003"
Source="Interop.SpeechLib" ErrorCode=-2147201021 StackTrace: 在 SpeechLib.SpVoiceClass.Speak(String Text, SpeechVoiceSpeakFlags Flags) 在 SpeechSynthesisMemLeakTest.Program.Test2() 在 D:\Proj\TestSolutions\CSharp_Quick_Apps\SpeechSynthesisMemLeakTest\Program.cs:第 60 行 SpeechSynthesisMemLeakTest.Program.Main(String[] args) 在 D:\Proj\TestSolutions\CSharp_Quick_Apps\SpeechSynthesisMemLeakTest\Program.cs:第 17 行在 Microsoft 的 System.AppDomain._nExecuteAssembly(Assembly assembly, String[] args)。 VisualStudio.HostingProcess.HostProc.RunUsersAssembly() 在 System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state) 在 System.Threading.ThreadHelper.ThreadStart() InnerException:
谁能告诉我如何正确使用该标志说出 SSML 内容?
svg - 如何创建 SVG 动画并同步音频
我想创建一个 SVG 动画并使用 SSML 包含旁白,理想情况下我希望能够在浏览器中播放动画。
我做了一些研究,SMIL(同步多媒体集成语言)听起来像我想要的,但据我所知,SMIL 没有得到广泛支持(http://www.w3.org/AudioVideo/ 声明“SYMM WG 是自 2012 年 4 月 1 日起关闭。”我不确定这是否意味着规范完全失效)。
谁能告诉我是否有支持 SVG、SSML 和 SMIL 的开发工具或播放器。(Ambulent(http://www.ambulantplayer.org/) 播放器支持 SMIL,但不支持 SSML)?
对于如何使用其他技术实现相同结果的任何建议,我也将不胜感激。