问题标签 [text-to-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1140 浏览

windows-vista - 使用 MS SAPI TTS 无意改变音高

是否有其他人使用 MS SAPI TTS 语音经历过(并且可能已解决)无意的音高变化?

我正在使用带有 SAPI 5.1 的 SpVoice 自动化接口。

现在,我的应用程序(VB6 应用程序)可以进入 TTS(Microsoft Anna)开始听起来像花栗鼠的状态(适当的速率,但高音),甚至重新启动 Vista 也不能解决问题。

我将 XML 传递给 Voice.Speak() 函数。我已经尝试在所有其他 XML 之前发送 < pitch absmiddle="0" /> ,但它仍然不能纠正音高问题。当我在语音控制面板中尝试 TTS 语音预览时,语音具有正常音高。

过去我在 XP 中出现过这个问题,但是重新启动似乎可以纠正它。

0 投票
9 回答
81290 浏览

java - Java:文本到语音引擎概述

我现在正在寻找 Java 文本转语音 (TTS) 框架。在我的调查中,我发现JSAPI 实现页面上列出了几个 JSAPI1.0-(部分)兼容的框架,以及一对似乎不遵循 JSAPI 规范的 Java TTS 框架(MarySay-It-Now) . 我还注意到目前不存在 JSAPI 的参考实现。

我为 FreeTTS(JSAPI impls 页面中列出的第一个)所做的简短测试表明,它远非阅读简单明了的单词(例如:ABC、黑板)。其他测试目前正在进行中。

这是问题(实际上是6):

  1. 您使用过哪些基于 Java 的 TTS 框架?
  2. 您认为哪些能够阅读最大的词库?
  3. 他们的语音质量怎么样?
  4. 他们的表现如何?
  5. 现场有哪些具有 Java 绑定的非 Java 框架?
  6. 你会推荐他们中的哪一个?

预先感谢您的意见和建议。

0 投票
5 回答
3538 浏览

audio - 音频样本库(口语文本)

对于我们目前正在进行的项目,我们需要一个包含多种不同语言的口语单词库。

两种选择似乎是可能的:文本转语音或母语人士的“真实”录音。由于质量对我们很重要,我们正在考虑走后一条路。

为了为我们的应用程序创建原型,我们正在寻找包含尽可能多不同语言的单词的库。为了感受我们方法的质量,这个库不应该由合成语音组成。

您知道任何可用/可访问的库吗?

0 投票
7 回答
20561 浏览

text-to-speech - 浏览器有免费的文字转语音吗?

想知道是否有任何文本转语音软件可用作 IE 或 Firefox 的插件。

0 投票
5 回答
682 浏览

java - (声码)需要一些帮助来寻找文字转语音插件

我正在寻找一个可以语音说出字符的插件。它是用于非商业用途的,如果它可以发出更多的语言,比如亚洲、英语等,那就太好了……我用谷歌搜索了它,但似乎找不到任何免费使用的东西。

更新:这是供网络使用

0 投票
5 回答
1148 浏览

.net - TTS 引擎推荐

任何人都可以推荐用于电话应用程序的可靠且具有成本效益的 TTS 引擎吗?

要求是:

  • 必须支持Windows平台
  • 必须具有丰富的语言支持,包括对口音的支持(即美国英语与英国英语)

很高兴有:

  • 与 .NET 平台集成
  • 预算友好
  • 虽然输出将被定向到电话应用程序,但能够完全控制输出质量(用于未来的潜在用途)会很好

我很想听听不同包装的任何和所有经验。

注意:不幸的是,开源包在这里不是一个选项。

0 投票
1 回答
2928 浏览

delphi - Vista中的文字转语音

我通过在 2000/NT/XP 中使用 Delphi 创建 OLE 对象来做到这一点,如下所示:

但这在 Vista 中不起作用,我怎样才能让我的程序在 Vista 中简单地说一些文本?

0 投票
11 回答
69673 浏览

c# - C# 语音识别 - 这是用户所说的吗?

我需要编写一个使用语音识别引擎的应用程序——无论是内置的 vista 引擎还是第三方引擎——它可以显示一个单词或短语,并识别用户何时阅读它(或它的近似值) )。我还需要能够在语言之间快速切换,而无需更改操作系统的语言。

用户将在很短的时间内使用该系统。该应用程序需要在不需要首先针对用户的声音训练识别引擎的情况下工作。

如果这可以在 Windows XP 或更低版本的 Windows Vista 上运行,那也太棒了。

可选地,系统需要能够以用户选择的语言将屏幕上的信息读回给用户。我可以使用预先录制的画外音来解决这个规范,但首选方法是使用文本到语音引擎。

任何人都可以为我推荐一些东西吗?

0 投票
3 回答
7428 浏览

c# - Question SpeechSynthesizer.SetOutputToAudioStream 音频格式问题

我目前正在开发一个应用程序,该应用程序需要传输编码为特定音频格式的语音。

这表明音频是 PCM 格式,每秒 8000 个样本,每样本 16 位,单声道,每秒 16000 个平均字节,块对齐为 2。

当我尝试执行以下代码时,我的 MemoryStream 实例中没有写入任何内容;但是,当我从每秒 8000 个样本更改为 11025 个样本时,音频数据已成功写入。

使用 8000 的采样率时没有记录任何异常或错误,我在有关 SetOutputToAudioStream 的文档中找不到任何有用的信息,以及为什么它以每秒 11025 个样本而不是 8000 的速度成功。我有一个涉及我的 wav 文件的解决方法使用一些声音编辑工具生成并转换为正确的采样率,但如果可以的话,我想从应用程序中生成音频。

一个特别有趣的地方是 SpeechRecognitionEngine 接受该音频格式并成功识别了我合成的波形文件中的语音......

更新:最近发现这种音频格式对于某些已安装的声音成功,但对于其他声音则失败。它专门针对 LH Michael 和 LH Michelle 失败,并且失败因 PromptBuilder 中定义的某些语音设置而异。

0 投票
2 回答
2678 浏览

.net-3.5 - System.Speech.Synthesis 安装备用语言声音

.net framework 3.5(或 vista)为我提供了与 Speech.Synthesis api 一起使用的英语语音(我认为是 David)。我需要一个法语语音才能与我正在为我的孩子构建的法语听写练习应用程序一起使用,以提高他们的法语拼写。该 api 允许我在创建语音时更改文化,但默认的英语语音无法正确发音法语单词。

我一直无法找到从 Microsoft 下载法语语音的任何方法。这可能吗?我确实从 Cepstral 下载了一个 Demo 商业声音,但它被削弱了,使其无法使用(即使用于测试)。我不想买任何东西,因为这个练习只是为了好玩。

我曾希望无需求助于商业专业声音就可以轻松获得替代语言的声音。有没有免费的替代品?