我这里有个情况。假设我有两个包含一些声音的短音频文件。假设,第一个文件有声音“你好”(音频 1),第二个文件有某人说的“再见”(音频 2)。还有另一个音频文件,其中包含同一个人所说的“你好”(音频 3),但录音不同。
如何检测到音频 3 与音频 1 相似(与扬声器无关)?我在这里处理声音,而不仅仅是语音。因此,也可以用哨声代替单词。
我这里有个情况。假设我有两个包含一些声音的短音频文件。假设,第一个文件有声音“你好”(音频 1),第二个文件有某人说的“再见”(音频 2)。还有另一个音频文件,其中包含同一个人所说的“你好”(音频 3),但录音不同。
如何检测到音频 3 与音频 1 相似(与扬声器无关)?我在这里处理声音,而不仅仅是语音。因此,也可以用哨声代替单词。