“festival”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

853 浏览

shell - 编写一个 shell 脚本来生成波形文件

我正在考虑编写一个脚本来将 .txt 文件的内容转换为 .wav 文件。

当前执行的命令是：

所以，很简单的命令。它查看 .txt 文件中的内容并将其全部转换为 .wav 文件。但我想做的是只有一个包含多行的 .txt ，并且每一行都将转换为 .wav 文件。例如：line 0, line 1, line 2, ... to be converted into 0.wav, 1.wav, 2.wav, ... etc

关于如何实现这一目标的任何想法？我也对不同的方法持开放态度。

2017-03-30T05:18:23.097

0 投票

1 回答

290 浏览

c++ - ROS语音识别

我尝试做的事情和实际做的事情的简短总结。

在我的项目中，我有两个简单的节点：一个用于收听和发布，另一个用于说和订阅。我分别将它们命名为 listenerNode 和 speakNode。

我想要完成的任务非常简单，我会让用户说“记住我”，这将被识别为关键字并发布到voiceCommandCallback说话节点中的方法，这样我的机器人就可以说“好的，请说出你的名字”。然后，回到侦听节点，除了发布该关键字短语之外，它还将调用recognize_from_mic_with_dict()您可以猜到的将使用名称字典运行的方法。

此recognize_from_mic_with_dict()方法将侦听名称并将尝试将该名称发布到namesCallback()侦听节点中，这是我检查发布的内容是实际名称还是只是胡言乱语的地方，在这种情况下，我会问用户重复他/她的名字并再次订阅，recognize_from_mic_with_dict()以便它可以再次收听。

这听起来可能更复杂，但这是我能想到的实现这种“模式切换”的唯一方法。问题是，如果它听到胡言乱语，它会说“对不起，我没听清楚。请重复一遍！” 我想知道是否有办法让监听节点忽略机器人所说的任何内容，因为它试图从自己的句子中识别名字。

c++voice-recognition ros pocketsphinx festival

2017-04-12T22:29:33.070

0 投票

0 回答

2072 浏览

ubuntu - _int_free 中的核心转储 ...在 malloc.c:3902 ...所有可执行文件

我在windows 10（主机）的virtualbox（5.1.18）中运行ubuntu（16.10）（guest）

我已经从各个站点下载了节日 tts 代码，并尝试在此设置上构建它。

代码可以毫无障碍地构建。

但是在运行时，所有可执行文件都会崩溃并转储核心。

然后我为构建启用调试（gcc -g）并在 gdb 中运行 exec。在 gdb 崩溃之后，当我执行 where... 时，我看到了这种模式（这种模式对于所有崩溃的可执行文件都是相同的）

很明显，这与我的设置有关，因为，1. 这不是我的代码，并且该代码正在全世界范围内使用，没有任何问题！2. 我最近通过增加根分区大小对来宾 linux 进行了更改。

如果我需要提供更多详细信息，请告诉我。

请让我知道任何指导方针，以便我可以继续解决此问题。

提前致谢。

ubuntu virtualbox libc++festival

2017-04-16T21:30:24.580

0 投票

2 回答

2503 浏览

text-to-speech - 在节日中更改语音时 SIOD 错误未绑定变量

我正在使用双音素连接方法在节日中定义新声音（旁遮普语）。我已经创建了所有必要的文件。但是当我尝试将声音从英语更改为旁遮普语时，我得到了 SIOD 错误：

请告诉我解决方案。

text-to-speech festival

2017-05-25T07:05:39.153

0 投票

2 回答

845 浏览

ubuntu - 在 ubuntu 中使用 hts 编译节日时出现 SIOD 错误

我尝试在 Ubuntu16.10 上编译 HTS-demo_CMU-ARCTIC-SLT。

但是发生了以下错误。

我认为 Festival 导致了这些问题。这是我安装音乐节的过程。

你能帮我解决这个问题吗？

[添加]

我从（http://www.cstr.ed.ac.uk/downloads/festival/2.4/）获得节日版本 2.4

ubuntu text-to-speech htk festival

2017-05-30T11:13:32.267

0 投票

0 回答

55 浏览

text-to-speech - EST 错误：找不到双音素对

我正在使用双音素连接方法在节日中定义新声音（旁遮普语）。我已经创建了所有必要的文件。首先，我正在尝试一个单词的玩具示例，即“ksr”（旁遮普语中的“ਕਸਰ”）接下来我在 phoneset.scm 文件中添加了电话及其功能，我在 lexicon.scm 文件中添加了词典条目。我还手动定义了从字母到声音的规则。还制作了带有单词“ਕਸਰ”及其音节结构的 lex.out 文本文件。我还在 dur.data 文件中设置了电话的持续时间

我使用 audacity 记录器记录了双音素 ks (ਕ-ਸ) 和 sr (ਸ-ਰ) 的无意义单词波形文件，并手动识别了双音素的开始和结束，还创建了带有以下条目的文件 text.done.data

并创建了带有条目等的 .est 索引文件

之后，我使用以下命令提取音高标记make_pm_wav, make_pm_fix make_pm_lpc等

运行命令后festival festvox/net_pa_pn_diphone.scm "(voice_net_pa_pn_diphone)"它进入节日但在此之前它说

我改变声音

当我在节日中运行说电话命令时，它会给出以下错误：

这个问题的解决方案是什么？我正在使用节日 2.4。

text-to-speech festival

2017-06-28T08:24:48.407

0 投票

1 回答

351 浏览

festival - SIOD 错误：不是数字

有时当我使用(SayText " <some sentence >") 它时会出现以下错误SIOD ERROR: not a number。例如

当我回溯它时

festival

2017-07-11T05:54:21.770

0 投票

1 回答

88 浏览

scheme - 为什么节日/计划停止说话？

我有一个speakall.scm包含以下内容的节日/计划文件：

如果我让 Festival 播放 file1.txt 或 file2.txt，它会读取整个文件。然而，当结合到上面，并运行

它在 file2.txt 的早期就出现了。

我猜一些缓冲区正在某个地方填充而不是清空。

File1 有 43 个字，file2 有 50 个字。

我怎样才能让它说出所有两个文件（以及我可能添加的任何其他文件）？

scheme text-to-speech festival

2017-07-23T00:22:26.730

0 投票

1 回答

353 浏览

c++ - 基本节日节目有未定义的参考错误

我目前正在尝试编译这个基本的节日程序

当我尝试使用 g++ 构建程序时，出现以下错误：

根据http://festvox.org/docs/manual-2.4.0/festival_28.html#C_002fC_002b_002b-API，我添加了festival/src/include 和speech_tools/include 到搜索路径，除了链接festival/src /lib/libFestival.a、speech_tools/lib/libestools.a、speech_tools/lib/libestbase.a 和 speech_tools/lib/libeststring.a。

我正在尝试使用 g++ 和festival 2.4.0 在 Arch Linux 上构建它。

编辑：我正在使用的构建命令是

我正在使用 CodeBlocks，所以这是默认的构建命令

编辑 2：在构建命令中添加 -lncurses 消除了与 readline 相关的未定义参考错误，但其他错误仍然存在

编辑 3：将 libestbase 设置为链接最后修复了错误。

c++text-to-speech undefined-reference festival

2017-11-13T19:59:20.783

0 投票

0 回答

218 浏览

text-to-speech - 为 MarryTTS 训练新声音时观察序列太少

我正在尝试用德语为 MaryTTS 建立一个新的声音一段时间，但到目前为止还没有成功。我遵循了一个教程（https://github.com/marytts/marytts/wiki/HMMVoiceCreation）并试图理解每个步骤。无论我做什么，我都会卡在第 14 步（HMMVoiceMakeVoice），错误是：

错误 [+2121] HInit：观察序列太少

这通常意味着在我的数据集中找不到被测手机（本例中为 en9）。

更改语言环境后，正如 Nikolay Shmyrev 指出的那样，手机“de27”上发生了同样的错误。

不过我对此表示怀疑，因为我使用了大约 500 个音频文件，这些文件的长度至少为 5 秒，因此总共有一个多小时的镜头。

事实上，我跳过了“en9”电话，因为我不知道它到底代表什么。下一个失败的是“oI”，我在前几个音频文件中手动定位了大约十次。

我认为这与自动标记无法正常工作有关（步骤 2-4），但我不知道，我能做些什么来获得更好的结果？

编辑：我上传了在这一步之前获得的所有文件，可以在这个共享的谷歌驱动器上检查这些文件。请注意，出于版权原因，我无法上传 wav 文件夹。在日志目录中，您可以找到每个步骤之后的日志。我在那里找不到任何问题，但也许有人会。

我不完全理解生成数据的结构，但我认为更改MARYBASE/mary/trickyPhones.txt并再次运行 make 工具足以将地图名称从“tS”更改为“Z”，这在德语中听起来大致相同。但是 HMMVoiceMakeVoice 仍然会产生相同的输出。

text-to-speech speech-synthesis festival marytts

2018-01-15T13:36:21.837

问题标签 [festival]

Reference