问题标签 [speech-synthesis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1372 浏览

perl - perl 中的语音合成

是否可以让计算机(windows 或 linux、mac)用 perl 说话?我知道使用 VB 脚本是可能的。但是 perl 呢?

在VB中我们只写

我们如何在 perl 中做到这一点?

0 投票
1 回答
503 浏览

php - 愚蠢的想法:来自 PHP 服务器的 Mac 语音?

我想合成 Mac OS X 语音,但我使用的是 PC。我可以在家里的 Macbook 上设置一个 PHP 服务器,让它为我合成文本,然后通过 Web 请求返回给我吗?

http://mymacbook.com/speak.php?t=why+hello+there

什么秘密的 PHP 代码可以解锁这种可能性?我知道我可以在命令行上合成语音,say -o "output.aiff" -f "input.txt"但我需要这里的结缔组织方面的帮助。

- 我不想要 Cepstral 或 AT&T 的在线语音合成器的链接,因为我想使用特殊的 Mac 语音合成语法。

0 投票
2 回答
169 浏览

iphone - 是否可以在 iPhone 项目中使用一些 C 源代码?

我找到了一个支持多种语言的语音合成器(http://espeak.sourceforge.net/index.html)。但是可用的源代码是用 C 编写的。

我该怎么做才能让它在 iPhone 上运行?

0 投票
2 回答
501 浏览

objective-c - 如何找到 NSSpeechSynthesizer 的“速率”属性的范围?

我有一个 OS X 应用程序,它使用NSSpeechSynthesizer该类来阅读一些文本。我需要能够设置阅读速度,这是使用rate. NSSpeechSynthesizer然而,不同的声音有不同的基线阅读率和不同的范围。问题是我找不到从语音中获取此范围的方法,以便我知道语音可以接受哪些值。这很重要,因为我希望能够从范围的差异中抽象出来,让用户选择慢/正常/快之类的东西。但是对于基线为每分钟 180 个单词的语音,100 的值将被认为是慢的,对于基线为每分钟 100 个单词的语音显然不是这种情况。

有没有办法获得这些范围?我在类参考中没有发现任何有用的东西NSSpeechSynthesizer

0 投票
1 回答
714 浏览

.net - 微软 TTS 语音

是否可以设置特定单词或短语的语气或重点?

例如:Good Morning会用轻松的声音,而The nuclear plant is about to melt down会更紧急。

我知道我可以改变播放速度,但有什么更聪明的东西我不知道吗?其他 TTS 引擎是否支持这一点(并且它们中的任何一个都是开源的)?

谢谢

0 投票
1 回答
2534 浏览

c# - C# (C++) SAPI - TTS - 如何获取正在阅读的文本的语音计时

请问有人可以帮我吗?我搜索了一些示例,如何通过 SAPI 获取有关 TTS 中语音文本的信息(我正在用 C# 编写我的应用程序,但不需要,SAPI 在 C++ 中是相同的,等等)我需要的信息是例如:用户将在文本框中写:

“这是一个文本” ..

tts.Speak("这是一段文字"); // 这将“读取”它..

好的,很好......但我也需要获取有关“时间”的信息..

例如:

“Th”(“This”的第一个声音(音素))在 0.01 毫秒内被“读取”。

“i”(“is”的第一个声音)在 0.5 毫秒内被“读取”..

“e”(“文本”的第二个声音)在 1.02 毫秒内被“读取”。

当我保存 SAPI 生成的 .wav 文件时,我需要在 .wav 中获取有关时间的信息,以便后续“处理”wav 文件。

对不起我的英语,对不起我对我的问题的糟糕描述,但问题是我认为很简单,所有人都会理解。如果不是,我将尝试再次描述问题:) ^^..

0 投票
1 回答
248 浏览

open-source - 是否有任何 FLOSS 项目利用人工输入进行语音合成?

是否有任何使用录制的语音数据生成合成语音的开源、开放内容项目?(目标是合成/模拟特定个人的语音。作为旁注,这个过程、目标或提取的数据是否有名称?“语音签名”?)

我想工作流程会是这样的:

  • 从标准化文本中录制语音(“泰迪熊坐在垫子上。”)
  • 挑选音素(猫的“a”),解释口音
  • 获取使 Alice 的“eh”听起来与 Betty 的“eh”不同的数据
  • 使用适合口音的音素和语音签名将文本转换为语音

回答这个问题是请求Jack Angel泰迪Wonkers)为了人类而将他舒缓的声音签名捐赠给公共领域的关键一步。

0 投票
2 回答
1639 浏览

android - 扩展安卓 TTS 引擎

在android中为现有的TTS引擎添加新的语言,我可以不从头开始修改现有的引擎吗?由于语音合成框架已经完成,也许我可以根据它为我的语言实现 TTS,而不是采用不同的方法。

需要建议。

谢谢

0 投票
2 回答
673 浏览

java - Linux/Ubuntu - 不使用 FreeTTS 从 Java 进行语音合成

我花了几天的时间试图让它工作:在 Ubuntu 系统上使用 FreeTTS 从 Java 进行语音合成,如果可能的话,它似乎比我预期的要复杂得多。此配置存在一些我无法解决的问题。

所以,我改变了主意,决定以其他方式实现它。我只需要在应用程序的执行过程中合成一些文本,所以我的问题是:有人知道任何其他方法可以使它成为可能并且仍然是独立于平台的(假设我必须安装某种额外的软件在我需要运行它的机器)?

非常感谢。

0 投票
2 回答
844 浏览

multithreading - 在 C# 中使用多线程时如何实现“等待”状态

我有一个要应用多线程的类。我想一次只允许 1 个线程“startSpeaking()”。这是我的尝试:

我也在createVoiceThread()从另一个类调用方法。它由另一个类中的类似约定调用。例如

我的问题是如何修改这个程序,以便在startSpeaking()被任何线程调用时,它一次只播放一个语音模式。