问题标签 [text-to-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2499 浏览

c# - C# 中的 SpeechSynthesizer 创建具有 22kHz 的 wav ...需要为 16kHz

我的 C# 应用程序需要将文本转换为 wav 文件并将其注入到 Skype 通话中。创建 wav 文件的代码如下。问题是该文件有 22kHz 的采样率,而 Skype 只接受 16kHz。

有没有办法调整这个设置?

0 投票
2 回答
4596 浏览

c++ - Espeak SAPI/dll 在 Windows 上的使用?

问题:我正在尝试使用 espeak 文本转语音引擎。所以我让它在 linux 上工作得很好(下面的代码)。现在我也想把这个基本程序移植到 Windows 上,但这几乎是不可能的......

部分问题是windows dll只允许AUDIO_OUTPUT_SYNCHRONOUS,这意味着它需要一个回调,但我不知道如何从回调中播放音频......首先它崩溃了,然后我意识到,我需要一个回调函数,现在我在回调函数中获取数据,但我不知道如何播放它......因为它既不是wav文件也不是像Linux上那样自动播放。

sourceforge 站点相当没用,因为它基本上说使用 SAPI 版本,但是没有关于如何使用 sapi espeak dll 的示例...

无论如何,这是我的代码,有人可以帮忙吗?

上面的代码适用于 Linux。下面的代码是关于我在 Vista x64(32 位 emu)上的代码:

0 投票
1 回答
876 浏览

c++ - 如何访问线程外的线程数据

问:我在一个线程中启动 MS 文本转语音引擎,以避免 DLL_attach 崩溃。它开始正常,文本到语音引擎被初始化,但我无法在线程外访问 ISpVoice。如何在线程外访问 ISpVoice?毕竟是全局变量...

您可以在这里找到 XPThreads:http: //www.codeproject.com/KB/threads/XPThreads.aspx

0 投票
2 回答
2303 浏览

android - TextToSpeech setOnUtteranceCompletedListener 总是返回 -1 错误?

我一直在使用 Android 的 TTS 功能并取得了普遍的成功,但是其中一个拒绝为我工作;我无法成功地将 OnUtteranceCompletedListener 分配给我的 TextToSpeech 对象。

我尝试在我的一个类中实现 OnUtteranceCompletedListener,并且尝试创建一个新的独立 OnUtteranceCompletedListener 实例。这两种方法都很容易实现,并且似乎可以毫无例外地产生适当的侦听器......但是 setOnUtteranceCompletedListener(myListener) 总是返回 -1(错误)。

这方面的文档似乎很简单。有没有人让这个工作?我的目标是 SDK 4。SDK4/v1.6 是否存在已知问题?

0 投票
3 回答
8362 浏览

c# - 多语言文本到语音库?

我目前正在考虑开发一个能够以多种语言阅读文本到语音的小型客户端。主要针对英语和日语。

所以我的问题是,有没有人知道一个能够阅读英语和日语的图书馆?

我最初的目标开发语言是 c#

谢谢你的时间。

0 投票
3 回答
3117 浏览

visual-c++ - C++ Microsoft SAPI:如何将 Windows 文本到语音输出设置到内存缓冲区?

我一直试图弄清楚如何使用 Windows SAPI 5.1 将文本“说”到内存缓冲区中,但到目前为止还没有成功,尽管它看起来应该很简单。

一个将合成语音流式传输到 .wav 文件的示例,但没有关于如何将其流式传输到内存缓冲区的示例。

最后,我需要在 char* 数组中以 16 kHz 16 位 little-endian PCM 格式合成语音。目前我创建了一个临时 .wav 文件,在那里重定向语音输出,然后阅读它,但这似乎是一个相当愚蠢的解决方案。

有谁知道该怎么做?

谢谢!

0 投票
0 回答
3294 浏览

text-to-speech - Microsoft TTS(文本到语音)数据文件位置

好的,所以我下载了一些 TTS 引擎来替换默认的 microsoft TTS 引擎,并使我的程序听起来更“人性化”——基本上我想知道 TTS 引擎文件存储在本地 pc 上的什么位置(windows 7 )

- 我拥有的文件是 .Dat 格式,有没有人知道应该去哪里注册为文本到语音的语音?

干杯。

@UPDATE:
好的,通过注册表搜索后,我看到我需要为 dat 文件创建一个新的注册表项和值以及文件所在的位置、格式等......我将其注册为现在文本到语音的语音,但是当我尝试加载它时,我收到以下错误:“无法播放此语音。请尝试选择其他语音或选择其他音频输出设备。” - 有任何想法吗?-- 有什么方法可以检查我下载的 DAT 文件的编码吗?

0 投票
2 回答
1265 浏览

c++ - 如何使用 g++ 在 C++ 程序中链接节日 TTS 库

我正在使用 Festival c++ Api,但在提供的手册中

http://www.cstr.ed.ac.uk/projects/festival/manual/festival_28.html#SEC132

说要链接festival/src/lib/libFestival.a 等,所以请告诉我hw 将它们与我的c++ 程序链接

0 投票
2 回答
4053 浏览

c++ - Linux 中有哪些语音库?

谈到 Linux 中的 TTS(文本到语音)库,开发人员有哪些选择?

大多数发行版都附带哪些库?

有最小的图书馆吗?每个库提供什么功能?

我主要从 C++ 的角度来解决这个问题,尽管 Python 也适合我。

0 投票
6 回答
335 浏览

ms-word - 是否有 .NET 库/实用程序可以将 Word 文档转换为 MP3 格式?

有谁知道将 Microsoft Word 文档转换为 MP3 或 WAV 格式的任何得到良好支持/经过验证的方法,以便听力受损的人可以“收听”我存储在基于 Web 的文档管理系统中的文档?

我已经构建了这样的界面,以便某人可以使用电话获取可用文档列表,日期和标题通过电话“读取”给他们,但现在我希望能够让某人真正收听内容存储在系统中的 Word 文件。

理想情况下,让我在每次上传后转换 DOC -> MP3 的 .NET 库或实用程序是最好的,但按需“读取”文件的库或实用程序也可以。