我有两个语音音频文件。每一个都是从电话交谈中记录下来的,它们的长度不同(第一个文件长 3 秒,第二个文件长 5 秒)。我想测量两个文件的相似性。请注意,我对语音信号中的文本内容不感兴趣(即 NO Speech to Text)。我只需要测量相似度并获得分数或百分比。
我发现很少有工具可以进行音频指纹分析,但我发现几乎所有工具都针对音乐音频文件,并且在其语音时表现不佳。
我有两个语音音频文件。每一个都是从电话交谈中记录下来的,它们的长度不同(第一个文件长 3 秒,第二个文件长 5 秒)。我想测量两个文件的相似性。请注意,我对语音信号中的文本内容不感兴趣(即 NO Speech to Text)。我只需要测量相似度并获得分数或百分比。
我发现很少有工具可以进行音频指纹分析,但我发现几乎所有工具都针对音乐音频文件,并且在其语音时表现不佳。