我有一个小的人类声音声学数据集,我想对其进行扩充,然后将其传递给二进制分类器。
我熟悉图像的数据增强,但声学数据集是如何完成的?
我用 Pytorch & TorchAudio找到了 2 个关于自动编码器和SpecAugment 的相关答案, 但我想听听您对特定于音频的“最佳方法”的看法。
我有一个小的人类声音声学数据集,我想对其进行扩充,然后将其传递给二进制分类器。
我熟悉图像的数据增强,但声学数据集是如何完成的?
我用 Pytorch & TorchAudio找到了 2 个关于自动编码器和SpecAugment 的相关答案, 但我想听听您对特定于音频的“最佳方法”的看法。