问题标签 [speech-synthesis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
perl - perl 中的语音合成
是否可以让计算机(windows 或 linux、mac)用 perl 说话?我知道使用 VB 脚本是可能的。但是 perl 呢?
在VB中我们只写
我们如何在 perl 中做到这一点?
php - 愚蠢的想法:来自 PHP 服务器的 Mac 语音?
我想合成 Mac OS X 语音,但我使用的是 PC。我可以在家里的 Macbook 上设置一个 PHP 服务器,让它为我合成文本,然后通过 Web 请求返回给我吗?
像http://mymacbook.com/speak.php?t=why+hello+there
什么秘密的 PHP 代码可以解锁这种可能性?我知道我可以在命令行上合成语音,say -o "output.aiff" -f "input.txt"
但我需要这里的结缔组织方面的帮助。
不- 我不想要 Cepstral 或 AT&T 的在线语音合成器的链接,因为我想使用特殊的 Mac 语音合成语法。
iphone - 是否可以在 iPhone 项目中使用一些 C 源代码?
我找到了一个支持多种语言的语音合成器(http://espeak.sourceforge.net/index.html)。但是可用的源代码是用 C 编写的。
我该怎么做才能让它在 iPhone 上运行?
objective-c - 如何找到 NSSpeechSynthesizer 的“速率”属性的范围?
我有一个 OS X 应用程序,它使用NSSpeechSynthesizer
该类来阅读一些文本。我需要能够设置阅读速度,这是使用rate
. NSSpeechSynthesizer
然而,不同的声音有不同的基线阅读率和不同的范围。问题是我找不到从语音中获取此范围的方法,以便我知道语音可以接受哪些值。这很重要,因为我希望能够从范围的差异中抽象出来,让用户选择慢/正常/快之类的东西。但是对于基线为每分钟 180 个单词的语音,100 的值将被认为是慢的,对于基线为每分钟 100 个单词的语音显然不是这种情况。
有没有办法获得这些范围?我在类参考中没有发现任何有用的东西NSSpeechSynthesizer
。
.net - 微软 TTS 语音
是否可以设置特定单词或短语的语气或重点?
例如:Good Morning
会用轻松的声音,而The nuclear plant is about to melt down
会更紧急。
我知道我可以改变播放速度,但有什么更聪明的东西我不知道吗?其他 TTS 引擎是否支持这一点(并且它们中的任何一个都是开源的)?
谢谢
c# - C# (C++) SAPI - TTS - 如何获取正在阅读的文本的语音计时
请问有人可以帮我吗?我搜索了一些示例,如何通过 SAPI 获取有关 TTS 中语音文本的信息(我正在用 C# 编写我的应用程序,但不需要,SAPI 在 C++ 中是相同的,等等)我需要的信息是例如:用户将在文本框中写:
“这是一个文本” ..
tts.Speak("这是一段文字"); // 这将“读取”它..
好的,很好......但我也需要获取有关“时间”的信息..
例如:
“Th”(“This”的第一个声音(音素))在 0.01 毫秒内被“读取”。
“i”(“is”的第一个声音)在 0.5 毫秒内被“读取”..
“e”(“文本”的第二个声音)在 1.02 毫秒内被“读取”。
当我保存 SAPI 生成的 .wav 文件时,我需要在 .wav 中获取有关时间的信息,以便后续“处理”wav 文件。
对不起我的英语,对不起我对我的问题的糟糕描述,但问题是我认为很简单,所有人都会理解。如果不是,我将尝试再次描述问题:) ^^..
open-source - 是否有任何 FLOSS 项目利用人工输入进行语音合成?
是否有任何使用录制的语音数据生成合成语音的开源、开放内容项目?(目标是合成/模拟特定个人的语音。作为旁注,这个过程、目标或提取的数据是否有名称?“语音签名”?)
我想工作流程会是这样的:
- 从标准化文本中录制语音(“泰迪熊坐在垫子上。”)
- 挑选音素(猫的“a”),解释口音
- 获取使 Alice 的“eh”听起来与 Betty 的“eh”不同的数据
- 使用适合口音的音素和语音签名将文本转换为语音
回答这个问题是请求Jack Angel(泰迪、Wonkers)为了人类而将他舒缓的声音签名捐赠给公共领域的关键一步。
android - 扩展安卓 TTS 引擎
在android中为现有的TTS引擎添加新的语言,我可以不从头开始修改现有的引擎吗?由于语音合成框架已经完成,也许我可以根据它为我的语言实现 TTS,而不是采用不同的方法。
需要建议。
谢谢
java - Linux/Ubuntu - 不使用 FreeTTS 从 Java 进行语音合成
我花了几天的时间试图让它工作:在 Ubuntu 系统上使用 FreeTTS 从 Java 进行语音合成,如果可能的话,它似乎比我预期的要复杂得多。此配置存在一些我无法解决的问题。
所以,我改变了主意,决定以其他方式实现它。我只需要在应用程序的执行过程中合成一些文本,所以我的问题是:有人知道任何其他方法可以使它成为可能并且仍然是独立于平台的(假设我必须安装某种额外的软件在我需要运行它的机器)?
非常感谢。
multithreading - 在 C# 中使用多线程时如何实现“等待”状态
我有一个要应用多线程的类。我想一次只允许 1 个线程“startSpeaking()”。这是我的尝试:
我也在createVoiceThread()
从另一个类调用方法。它由另一个类中的类似约定调用。例如
我的问题是如何修改这个程序,以便在startSpeaking()
被任何线程调用时,它一次只播放一个语音模式。