问题标签 [phoneme]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
515 浏览

android - Pocketsphinx在Android上使用音素识别的识别精度差,法语

我正在做一个项目,我必须将 Pocketsphinx 的语音功能集成到一个 android 应用程序中。事实上,我必须集成Pocketpshinx提供的音素识别功能,它应该能够识别法语的音素,例如语音识别器应该能够识别音节(如“de”、“re”、“se”等)、辅音(如“m”、“f”、“g”等)、双辅音(如“kl”、“ks”、“gr”等)和元音(如“a”、“o” “e”等)。现在,我已经集成了用于识别上述音素的 Pocketsphinx,但我的结果非常糟糕。例如,当我发音“o”时,识别结果有时是:“SIL ff ei au” (即使我根本没有发音字母“f”和“e”),或者在开头出现了其他不发音的东西。开头出现的字母并不总是相同的(有时我会得到“ll”、“uu”等)。但有时,我发音的字母出现在开头(例如,对于“a”,我得到“SIL aa SIL”),但这种情况很少发生。那么,你们能否帮助并让我知道可能是什么问题以及解决此问题的任何建议?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?或在开头出现其他不发音的东西。开头出现的字母并不总是相同的(有时我会得到“ll”、“uu”等)。但有时,我发音的字母出现在开头(例如,对于“a”,我得到“SIL aa SIL”),但这种情况很少发生。那么,你们能否帮助并让我知道可能是什么问题以及解决此问题的任何建议?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?或在开头出现其他不发音的东西。开头出现的字母并不总是相同的(有时我会得到“ll”、“uu”等)。但有时,我发音的字母出现在开头(例如,对于“a”,我得到“SIL aa SIL”),但这种情况很少发生。那么,你们能否帮助并让我知道可能是什么问题以及解决此问题的任何建议?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?你们能帮忙,让我知道可能是什么问题以及解决这个问题的任何建议吗?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?你们能帮忙,让我知道可能是什么问题以及解决这个问题的任何建议吗?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?

非常感谢您!

0 投票
0 回答
1241 浏览

nlp - 如何将文本转换为音素?

是否有可以将单词转换为各自音素的程序?只要其一致且可重现,使用哪种语法/格式并不重要。我有很多数据要转换,但 CMU 的文本到 Arpabet 转换器只转换了大约 100 个。我尝试运行“espeak [word] -x”来获取 espeak 的代码,但我必须等待程序在打印之前说出这个词。此外,我无法在运行数据的集群上安装 espeak。

0 投票
0 回答
347 浏览

nlp - 用于俚语的单词到音素转换器并在 Python 中组成单词

我目前使用 NLTK 在 python 中将单词转换为音素。这适用于库中的单词,但对于俚语和虚构的单词,NLTK 不起作用。例如像“whasup”“dawg”这样的词

有没有一个库可以最好地猜测俚语的音素?

似乎有这个工具,但没有一个 python 库。

0 投票
1 回答
150 浏览

cmusphinx - 我们可以以编程方式调用获取音频音素而不是使用命令吗

我已经使用 pocketsphinx 命令来提取音素,它工作正常

但现在我想以编程方式进行。要使用上述命令,我们需要转到“pocketsphinx\bin\Release\Win32”,然后运行该命令。是否可以在不移动到“pocketsphinx\bin\Release\Win32”文件夹的情况下以编程方式执行此操作?

此外,“pocketsphinx.js”中是否提供此功能?

0 投票
0 回答
274 浏览

c# - 语音词典输入的 SAPI 符号用法

我一直在做一些工作,通过 SAPI 5.4 的SpLexicon 接口(我认为这是唯一的方法)通过AddPronunciation函数将单词和发音添加到 Windows 语音词典,或者在我的情况下:

我正在参考美国英语音素表来确定要使用的 SAPI 符号。我注意到虽然使用强调标记“1”或“2”以及音节标记“-”似乎不会影响 TTS 发音。这些修饰符符号是否仅用于 XML 输入,还是我可能做错了什么?

0 投票
1 回答
307 浏览

java - 在java中查找.wav文件的基频

我有一个项目要完成,需要我找到人声的音素元音的基本频率。我是声音处理的新手,不知道如何进行。谁能指导我应该如何解决这个问题?

我尝试过使用 FFT 和自相关方法查找基频的搜索方法,但我无法找到解决方案。谁能给我一个代码片段?

0 投票
0 回答
95 浏览

python - 使用 Pocketsphinx 提取音素:RuntimeError: new_Decoder 返回 -1

我是堆栈溢出的新手。我正在尝试使用下面引用中提供的代码来实现结果。

https://stackoverflow.com/questions/30705028/convert-sound-to-list-of-phonemes-in-python

但是,此代码无法成功编译而没有错误。我收到以下错误。我该如何解决这个问题?谢谢。

RuntimeError Traceback (most recent call last) in () 17 18 # 解码流数据。---> 19 解码器 = 解码器(配置)20 21 解码器.start_utt()

~\Miniconda3\lib\site-packages\pocketsphinx\pocketsphinx.py in init (self, *args) 271 init (Decoder self, Config config) -> Decoder 272 """ --> 273 this = _pocketsphinx.new_Decoder(* args) 274 尝试:275 self.this.append(this)

RuntimeError: new_Decoder 返回 -1

0 投票
0 回答
167 浏览

c# - SAPI (5.4) 音素集是否适用于所有支持的语言?

SAPI 5.4 文档提到英语、中文、德语、西班牙语、法语和日语(能够)使用 SAPI 电话机。然而,SAPI 5.4 文档只包括(美国)英语汉语日语的音素集。

SAPI 支持的其他语言是否可以使用特定的电话机?根据关于德语电话集的(非常简短的)注释,我得到的印象是,英语集可用于导出非日语和非中文单词的发音。如果这是真的而不是以一种相当模糊的方式陈述的,那么希望人们可以在这里提供一些确认。谢谢!

0 投票
0 回答
150 浏览

c# - 如何获得语音识别来检测 SAPI 强调标记?

可以通过 SAPI 通过以下方式提取给定单词的默认音素:

  1. 带有文本到语音的语音单词并将输出存储在 .wav 中
  2. 使用 .wav 作为语音识别的输入
  3. 在识别单词后,从识别的短语元素中提取音素

但是,我无法捕获(如果有的话)强调标记(美国英语音素表中的“1”和“2” )。有没有办法做到这一点?

编辑:这是我迄今为止尝试过的(不是很漂亮,但很实用)。可悲的是,即使我通过 SAPI 语音词典修改手动添加对单词的强调,SpeechVisemeFeature 似乎总是显示“SVF_None”。有人知道为什么吗?

0 投票
1 回答
121 浏览

python - 如何提取具有相应时间步长的音素数据?

我可以使用 Pocketsphinx 成功地从音频文件中提取音素数据,但我怎样才能输出每个音素的持续时间?

这是打印的样子:('Phonemes', ['SIL', 'HH', 'M', 'W', 'M', 'HH', 'HH', 'HH', 'HH', 'HH'、'HH'、'HH'、'HH'、'HH'、'L'、'HH'、'L'、'M'、'M'、'M'、'HH'、'HH ','HH','HH','L','HH','HH','HH','HH','HH','HH','M','M','W', 'M'、'HH'、'HH'、'ER'、'ER'、'HH'、'HH'、'M'、'M'、'M'、'HH'、'M'、'M ','G','M','M','M','SIL','M','HH','M','ER','SIL','W','M','M'、'NG'、'M'、'M'、'HH'、'L'、'M'、'M'、'SIL'、'W'、'HH'、'L'、'M '、'SIL'、'HH'、'AE'、'V'、'R'、'HH'、'+SPN+'、'HH'、'HH'、'SIL'、'V'、'UW' ,'L','V','N','HH','D','V','D','+SPN+','D','B','AA','SIL', '+SPN+'、'HH'、'HH'、'AH'、'N'、'DH'、'UW'、'L'、'HH'、'UW'、'V'、'D'、' N','M','D','M','UW','P'])'SIL'、'W'、'HH'、'L'、'M'、'SIL'、'HH'、'AE'、'V'、'R'、'HH'、'+SPN+'、' HH'、'HH'、'SIL'、'V'、'UW'、'L'、'V'、'N'、'HH'、'D'、'V'、'D'、'+SPN+ '、'D'、'B'、'AA'、'SIL'、'+SPN+'、'HH'、'HH'、'AH'、'N'、'DH'、'UW'、'L' , 'HH', 'UW', 'V', 'D', 'N', 'M', 'D', 'M', 'UW', 'P'])'SIL'、'W'、'HH'、'L'、'M'、'SIL'、'HH'、'AE'、'V'、'R'、'HH'、'+SPN+'、' HH'、'HH'、'SIL'、'V'、'UW'、'L'、'V'、'N'、'HH'、'D'、'V'、'D'、'+SPN+ '、'D'、'B'、'AA'、'SIL'、'+SPN+'、'HH'、'HH'、'AH'、'N'、'DH'、'UW'、'L' , 'HH', 'UW', 'V', 'D', 'N', 'M', 'D', 'M', 'UW', 'P'])'V'、'UW'、'L'、'V'、'N'、'HH'、'D'、'V'、'D'、'+SPN+'、'D'、'B'、' AA'、'SIL'、'+SPN+'、'HH'、'HH'、'AH'、'N'、'DH'、'UW'、'L'、'HH'、'UW'、'V '、'D'、'N'、'M'、'D'、'M'、'UW'、'P'])'V'、'UW'、'L'、'V'、'N'、'HH'、'D'、'V'、'D'、'+SPN+'、'D'、'B'、' AA'、'SIL'、'+SPN+'、'HH'、'HH'、'AH'、'N'、'DH'、'UW'、'L'、'HH'、'UW'、'V '、'D'、'N'、'M'、'D'、'M'、'UW'、'P'])UW','P'])UW','P'])