问题标签 [text-to-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
3978 浏览

.net - 使用 System.Speech.Synthesis.SpeechSynthesizer 将文本转换为 MP3

我正在尝试将文本转语音保存到 MP3。目前我有 System.Speech.Synthesis 很好地与 WAV 文件对话。

现在注释掉的第一行生成了一个很好的 WAV 文件。目前我正在尝试用 MP3 输出流替换它并且没有太大成功。

我已经尝试过 Yeti.MMedia 转换器,但要么它不起作用,要么我没有让它成功工作。我必须在这里承认,我对编码、速度等知之甚少。

所以我的问题是,有没有人知道我可以这样说的好方法:

并让 SpeechSynthesizer 写入 WAV,然后将其转换为 MP3 并最终在 HDD 上。

0 投票
2 回答
1970 浏览

.net - Interop.SpeechLib.dll COM 异常

我正在使用 SpeechLib 进行非常简单的文本到语音的转换。在当地工作得很好。当我将应用程序部署到服务器上时,出现异常:

我没有运气做了以下事情:

  • 将 AppPool 设置为使用 LocalSystem 运行
  • 已将写入权限授予 SpeechLib 创建 wav 文件的文件夹

我在以下位置的用户遇到了完全相同的问题:

用户 1

用户 2

有没有人找到解决这个问题的方法?

谢谢!

0 投票
2 回答
2065 浏览

emacs - Emacs 中的文本转语音

我不是盲人,我只是想有一种方法让我的 Windows 机器大声读取缓冲区的内容。以下是基本要求:

  • 读取任何英文文本缓冲区。
  • 随时暂停阅读并随时恢复(当有人走进我的办公室时,不要等待几分钟才能完成大缓冲区)。
  • 在播放时调整回读速度。
  • 突出显示当前正在阅读的文本(可选)

我找到了几个可能的解决方案:

  • Emacspeak:专为盲人设计。看起来像一个独立的程序,而不是 Emacs 插件
  • Festival.el:需要节日。我找不到 Festival 的 Windows 二进制文件。有人有吗?
  • 我也可以自己写。如今,文本转语音 (TTS) 库已经很多了。交互式暂停功能可能是最大的技巧,但必须有一些库可以做到。

哪个选项是最好的计划?我不想在这里进行为期一周的项目。在 Windows 中编译 Festival 是一个痛苦的实验。对于我想要的东西,Emacspeak 看起来有点矫枉过正。

0 投票
1 回答
905 浏览

emacs - 控制节日输出

我正在努力改进 Emacs 上的 Festival。阅读句子时,我需要更好地控制 Festival。基本上,我需要两件事:

  1. 显示正在阅读的单词。
  2. 改变正在阅读的内容的速度(可能还有音高)。

理想情况下,Festival 会输出一些数据结构,将偏移/长度(通常是单词的开头/长度)与输出 WAV 文件(甚至是 wav 文件中的位置)联系起来。然后我可以使用 mplayer 之类的东西来构建一个播放列表,并以某种方式告诉我下一个单词何时播放以及该单词在缓冲区中的位置。

我也希望有一些简单的命令来改变正在阅读的内容的速度。但是,mplayer 可以为我做到这一点,所以如果我能让#1 工作,这没什么大不了的。

0 投票
1 回答
161 浏览

scheme - 调试 Scheme 程序

我正在为一个项目使用Festival,一个文本到语音合成器。它有一个 Scheme 脚本语言。我对计划很陌生,希望有人能提供帮助。我只想看看Festival当前的配置参数。我有一个 Scheme 提示,可以使用以下命令更改现有参数:

现在,我想一次查看每个参数,而不是一次只查看一个。是否有一个简单的方案命令来做到这一点?

0 投票
1 回答
774 浏览

android - Android 语音引擎的字符串输入

在我看来,TextToSpeech 类的“说话”方法仅适用于方法 onInit 或 onUtteranceCompleted。但是,onInit 和 onUtteranceCompleted 没有用于传递字符串的任何参数。

在下面的代码中,我尝试在方法之外定义一个全局字符串数组列表,并使用数组列表进行字符串输入。由于某种原因,它没有成功。但是引擎确实说“你睡得好吗”。任何帮助表示赞赏。

公共无效 onCreate(Bundle savedInstanceState) {

}

0 投票
4 回答
7705 浏览

c# - Microsoft Sam,SAPI 替代品

我们有一个计划使用 Microsoft 语音 API 的应用程序。现在我们使用 Microsoft Sam 语音在 Windows XP 上对其进行了测试,坦率地说,它听起来很糟糕......几乎不可能听到这个声音想说什么。

有没有其他更好的声音。有没有更好的更新或更新版本。是否有其他产品、开源项目等可以作为替代方案?

澄清一下——它需要有某种 API,所以我实际上可以针对它进行编程。

0 投票
1 回答
6393 浏览

asp.net - ASP.NET Web 应用程序的其他声音

我有一个使用 SAPI 进行 TTS 的 Web 应用程序。我在默认安装了 MS Sam 的 Windows Server 2003 上运行它。

据我了解,有许多第三方公司出售声音。对于商业应用程序,哪些公司提供不收取大量费用的许可证?他们是否有 API 可以轻松与 ASP.NET 应用程序集成?

我真的很想为应用程序添加更多声音。

编辑:还有答案吗?谢谢

0 投票
1 回答
5057 浏览

android - 我们可以从网页使用 Android TTS 吗?

如何从网页使用 Android TTS API?

0 投票
2 回答
1980 浏览

python - 从 PyTTS 的音频流中编码 mp3

我使用 python 2.5 处理音频 mp3 文件中的文本到语音转换文本。

我使用 pyTSS 作为 python Text-To-Speech 模块,以转换音频 .wav 文件中的文本(在 pyTTS 中无法直接以 mp3 格式编码)。因此,在那之后,我使用 lame 命令行编码器以 mp3 格式对这些 wav 文件进行编码。

现在,问题是,我想插入(特别是音频 mp3 文件的点,在两个单词之间)一个特定的外部声音文件(如声音警告)或(如果可能的话,生成警告声音)。

问题是:

1)我已经看到 PyTTS 有可能将音频流保存在文件或内存流中。使用两个功能:

tts.SpeakToWave(文件,文本)或 tts.SpeakToMemory(文本)

利用 tts.SpeakToMemory(text) 函数,并使用 PyMedia 我已经能够直接保存一个 mp3,但是 mp3 文件(复制时)听起来像唐老鸭一样难以理解!:-) 这里有一段代码:

我不明白问题出在哪里?!?这种可能性(如果它可以正常工作),最好跳过 wav 文件转换步骤。

2) 作为第二个问题,我需要将音频 mp3 文件(从文本到语音模块获得)与特定的警告声音连接起来。

显然,如果我可以在将整个音频内存流编码为唯一的 mp3 文件之前,将文本的音频内存流(在文本到语音模块之后)和警告声音的流连接起来,那就太好了。

我还看到 tksnack 库可以连接音频,但它们不能编写 mp3 文件。

我希望已经清楚了。:-)

非常感谢您对我的问题的回答。

朱利奥