3

我这里有个情况。假设我有两个包含一些声音的短音频文件。假设,第一个文件有声音“你好”(音频 1),第二个文件有某人说的“再见”(音频 2)。还有另一个音频文件,其中包含同一个人所说的“你好”(音频 3),但录音不同。

如何检测到音频 3 与音频 1 相似(与扬声器无关)?我在这里处理声音,而不仅仅是语音。因此,也可以用哨声代替单词。

4

1 回答 1

-2

您必须对每个文件进行统计分析,然后使用模式匹配来确定它们之间的相似程度。

最简单的单词解决方案是许可语音引擎的 api 版本,例如 Dragon,然后将音频文件转换为文本输出并进行比较。

于 2015-01-04T06:49:21.440 回答