问题标签 [sidekit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
162 浏览

python - 在使用 Sidekit 进行 UBM 扬声器适配期间出错

我已经训练了一个 UBM 模型,现在我正在尝试在出现以下错误时实现扬声器自适应。

例外:showenroll/something.wav 不在 HDF5 文件中

我在文件“feat”下有两个文件“enroll”和“test”,它们分别包含用于训练和测试的特征(.h5),并且我的enroll_idmap 是用音频(.wav)生成的,仅用于训练。而且,我的 wav 文件和 feat 文件是分开的。我想我遇到了 idmap 的问题。“enroll/something.wav”是我的enroll_idmap的rightid,但是那个“HDF5文件”指的是什么?

谁能告诉我这个错误是什么意思以及如何解决它?

这是我的enroll_idmap的代码

之后我得到了enroll_idmap和test_idmap:

这里是speaker-adaptation的代码,上面的错误是在enroll_stat.accumulate_stat(…)的执行过程中出现的:

这似乎不是一个大问题,但它让我停了几天,请帮助。

0 投票
0 回答
17 浏览

feature-extraction - Sidekit FeaturesExtractor 只为倒谱信息提供零

我想使用 GMM-UBM 和 Sidekit 进行说话人识别,第一步是使用 FeaturesExtractor 功能从我的音频文件中提取 MFCC 特征。但是,当我查看创建的 .h5 文件时,所有倒谱始终为零。然而,我希望看到倒谱也包含除零以外的数字。

我使用以下代码来提取特征:

感谢您提供的任何帮助。