-1

我正在研究一些有关音频分类的信息,更具体地说:平衡与不平衡的音频数据集。所以,假设在这里我有两个数据集类的两个文件夹:汽车声音和摩托车声音,汽车类文件夹有 1000 个 .wav,摩托车文件夹也有 1000 个 .wav。这是否意味着我有一个平衡的数据集只是因为数字相等?如果 car 类中的 .wav 文件的总大小为 500 Mb 而另一个为 200 Mb,该怎么办?好吧,假设它们的文件夹大小相同,但是如果汽车录音的单个音频片段的持续时间比摩托车类中的其他音频片段长怎么办?

4

1 回答 1

1

平衡数据集意味着两个类中的相同数字。通常会填充较短的数据以使其具有相同的长度以适合分类器。我没有音频背景,所以我不能说填充是否是常态,但如果你的网络有某种方式来协调不同的输入长度而不涉及创建更多输入,它将平衡 1000-1000。

于 2020-04-09T22:05:14.960 回答