我将 kaldi 用于 asr,现在我想使用 Kaldi 的 x 向量方法进行说话人分割。他们在 https://github.com/kaldi-asr/kaldi/tree/master/egs/sre16/v2 提供了一些示例分割脚本。他们还在https://david-ryan提供了 LDC 语料库的基本预训练模型-snyder.github.io/2017/10/04/model_sre16_v2.html
此预训练模型在未归档时具有以下结构:
我无法访问 LDC 语料库,我想知道如何根据自己的数据训练模型,然后如何使用该模型进行实际分割?