我微调了Nvidia Tacotron2的数据集。虽然工作得相当好,但有一些单词发音错误(我训练了一个德语数据集)。
我有另一组由同一扬声器制作的具有相应 metadata.csv 的波形文件
我如何过滤它以主要包括那些教模型缺少的发音的句子?
我微调了Nvidia Tacotron2的数据集。虽然工作得相当好,但有一些单词发音错误(我训练了一个德语数据集)。
我有另一组由同一扬声器制作的具有相应 metadata.csv 的波形文件
我如何过滤它以主要包括那些教模型缺少的发音的句子?