我有大约 200 个不同单词的频谱图。我希望能够(或至少尝试)将单词记录为 wav(就像我对原始单词所做的那样),将其转换为频谱图,然后尝试找到最佳匹配。
不幸的是,其中许多词非常相似(帽子、蝙蝠等)。我希望能够获得至少消除 50% 单词的匹配项。
我有哪些选择?我正在考虑获取两个频谱图之间的差异,但我不确定它的效果如何。
我有大约 200 个不同单词的频谱图。我希望能够(或至少尝试)将单词记录为 wav(就像我对原始单词所做的那样),将其转换为频谱图,然后尝试找到最佳匹配。
不幸的是,其中许多词非常相似(帽子、蝙蝠等)。我希望能够获得至少消除 50% 单词的匹配项。
我有哪些选择?我正在考虑获取两个频谱图之间的差异,但我不确定它的效果如何。