问题标签 [festival]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
shell - 编写一个 shell 脚本来生成波形文件
我正在考虑编写一个脚本来将 .txt 文件的内容转换为 .wav 文件。
当前执行的命令是:
所以,很简单的命令。它查看 .txt 文件中的内容并将其全部转换为 .wav 文件。但我想做的是只有一个包含多行的 .txt ,并且每一行都将转换为 .wav 文件。例如 :line 0, line 1, line 2, ... to be converted into 0.wav, 1.wav, 2.wav, ... etc
关于如何实现这一目标的任何想法?我也对不同的方法持开放态度。
c++ - ROS语音识别
我尝试做的事情和实际做的事情的简短总结。
在我的项目中,我有两个简单的节点:一个用于收听和发布,另一个用于说和订阅。我分别将它们命名为 listenerNode 和 speakNode。
我想要完成的任务非常简单,我会让用户说“记住我”,这将被识别为关键字并发布到voiceCommandCallback
说话节点中的方法,这样我的机器人就可以说“好的,请说出你的名字”。然后,回到侦听节点,除了发布该关键字短语之外,它还将调用recognize_from_mic_with_dict()
您可以猜到的将使用名称字典运行的方法。
此recognize_from_mic_with_dict()
方法将侦听名称并将尝试将该名称发布到namesCallback()
侦听节点中,这是我检查发布的内容是实际名称还是只是胡言乱语的地方,在这种情况下,我会问用户重复他/她的名字并再次订阅,recognize_from_mic_with_dict()
以便它可以再次收听。
这听起来可能更复杂,但这是我能想到的实现这种“模式切换”的唯一方法。问题是,如果它听到胡言乱语,它会说“对不起,我没听清楚。请重复一遍!” 我想知道是否有办法让监听节点忽略机器人所说的任何内容,因为它试图从自己的句子中识别名字。
ubuntu - _int_free 中的核心转储 ...在 malloc.c:3902 ...所有可执行文件
我在windows 10(主机)的virtualbox(5.1.18)中运行ubuntu(16.10)(guest)
我已经从各个站点下载了节日 tts 代码,并尝试在此设置上构建它。
代码可以毫无障碍地构建。
但是在运行时,所有可执行文件都会崩溃并转储核心。
然后我为构建启用调试(gcc -g)并在 gdb 中运行 exec。在 gdb 崩溃之后,当我执行 where... 时,我看到了这种模式(这种模式对于所有崩溃的可执行文件都是相同的)
很明显,这与我的设置有关,因为,1. 这不是我的代码,并且该代码正在全世界范围内使用,没有任何问题!2. 我最近通过增加根分区大小对来宾 linux 进行了更改。
如果我需要提供更多详细信息,请告诉我。
请让我知道任何指导方针,以便我可以继续解决此问题。
提前致谢。
text-to-speech - 在节日中更改语音时 SIOD 错误未绑定变量
我正在使用双音素连接方法在节日中定义新声音(旁遮普语)。我已经创建了所有必要的文件。但是当我尝试将声音从英语更改为旁遮普语时,我得到了 SIOD 错误:
请告诉我解决方案。
ubuntu - 在 ubuntu 中使用 hts 编译节日时出现 SIOD 错误
我尝试在 Ubuntu16.10 上编译 HTS-demo_CMU-ARCTIC-SLT。
但是发生了以下错误。
我认为 Festival 导致了这些问题。这是我安装音乐节的过程。
你能帮我解决这个问题吗?
[添加]
我从(http://www.cstr.ed.ac.uk/downloads/festival/2.4/)获得节日版本 2.4
text-to-speech - EST 错误:找不到双音素对
我正在使用双音素连接方法在节日中定义新声音(旁遮普语)。我已经创建了所有必要的文件。首先,我正在尝试一个单词的玩具示例,即“ksr”(旁遮普语中的“ਕਸਰ”)接下来我在 phoneset.scm 文件中添加了电话及其功能,我在 lexicon.scm 文件中添加了词典条目。我还手动定义了从字母到声音的规则。还制作了带有单词“ਕਸਰ”及其音节结构的 lex.out 文本文件。我还在 dur.data 文件中设置了电话的持续时间
我使用 audacity 记录器记录了双音素 ks (ਕ-ਸ) 和 sr (ਸ-ਰ) 的无意义单词波形文件,并手动识别了双音素的开始和结束,还创建了带有以下条目的文件 text.done.data
并创建了带有条目等的 .est 索引文件
之后,我使用以下命令提取音高标记make_pm_wav, make_pm_fix make_pm_lpc
等
运行命令后festival festvox/net_pa_pn_diphone.scm "(voice_net_pa_pn_diphone)"
它进入节日但在此之前它说
我改变声音
当我在节日中运行说电话命令时,它会给出以下错误:
这个问题的解决方案是什么?我正在使用节日 2.4。
festival - SIOD 错误:不是数字
有时当我使用(SayText " <some sentence >")
它时会出现以下错误SIOD ERROR: not a number。例如
当我回溯它时
scheme - 为什么节日/计划停止说话?
我有一个speakall.scm
包含以下内容的节日/计划文件:
如果我让 Festival 播放 file1.txt 或 file2.txt,它会读取整个文件。然而,当结合到上面,并运行
它在 file2.txt 的早期就出现了。
我猜一些缓冲区正在某个地方填充而不是清空。
File1 有 43 个字,file2 有 50 个字。
我怎样才能让它说出所有两个文件(以及我可能添加的任何其他文件)?
c++ - 基本节日节目有未定义的参考错误
我目前正在尝试编译这个基本的节日程序
当我尝试使用 g++ 构建程序时,出现以下错误:
根据http://festvox.org/docs/manual-2.4.0/festival_28.html#C_002fC_002b_002b-API,我添加了festival/src/include 和speech_tools/include 到搜索路径,除了链接festival/src /lib/libFestival.a、speech_tools/lib/libestools.a、speech_tools/lib/libestbase.a 和 speech_tools/lib/libeststring.a。
我正在尝试使用 g++ 和festival 2.4.0 在 Arch Linux 上构建它。
编辑:我正在使用的构建命令是
我正在使用 CodeBlocks,所以这是默认的构建命令
编辑 2:在构建命令中添加 -lncurses 消除了与 readline 相关的未定义参考错误,但其他错误仍然存在
编辑 3:将 libestbase 设置为链接最后修复了错误。
text-to-speech - 为 MarryTTS 训练新声音时观察序列太少
我正在尝试用德语为 MaryTTS 建立一个新的声音一段时间,但到目前为止还没有成功。我遵循了一个教程(https://github.com/marytts/marytts/wiki/HMMVoiceCreation)并试图理解每个步骤。无论我做什么,我都会卡在第 14 步(HMMVoiceMakeVoice),错误是:
错误 [+2121] HInit:观察序列太少
这通常意味着在我的数据集中找不到被测手机(本例中为 en9)。
更改语言环境后,正如 Nikolay Shmyrev 指出的那样,手机“de27”上发生了同样的错误。
不过我对此表示怀疑,因为我使用了大约 500 个音频文件,这些文件的长度至少为 5 秒,因此总共有一个多小时的镜头。
事实上,我跳过了“en9”电话,因为我不知道它到底代表什么。下一个失败的是“oI”,我在前几个音频文件中手动定位了大约十次。
我认为这与自动标记无法正常工作有关(步骤 2-4),但我不知道,我能做些什么来获得更好的结果?
编辑:我上传了在这一步之前获得的所有文件,可以在这个共享的谷歌驱动器上检查这些文件。请注意,出于版权原因,我无法上传 wav 文件夹。在日志目录中,您可以找到每个步骤之后的日志。我在那里找不到任何问题,但也许有人会。
我不完全理解生成数据的结构,但我认为更改MARYBASE/mary/trickyPhones.txt
并再次运行 make 工具足以将地图名称从“tS”更改为“Z”,这在德语中听起来大致相同。但是 HMMVoiceMakeVoice 仍然会产生相同的输出。