0

我尝试编写一个可以测试用户发音的程序。

该程序将播放一个波形声音,说一个英语句子,用户将尝试发音并记录他的声音,程序将检查该波形的相似性并指出用户的发音。

问题是,是否可以使用 .net 编写此程序?如果是,我可以使用哪些库?有什么指南可以开始吗?

4

2 回答 2

1

音乐识别程序通常表示频谱域中的声音(如捕捉音高)。

根据一些光谱表示,可以使用距离测量(欧几里得或其他)。

对于语音,时间维度是必要的。

在空间域中,考虑时间变形(慢与快)的翘曲测量似乎也是一个不错的选择。

模板匹配算法和 OCR 算法一样可能是很好的候选者,但现在您将处理声波。

声波算法的一个常见考虑因素是滑动窗口或分割。

于 2013-07-18T19:37:27.853 回答
1

梅苏特!

假设您使用的是 C#.NET,我可能会为您解答。一个简单的 Google 搜索让我看到了这个 YouTube 视频,它向您展示了如何“绘制音频波形”:http ://www.youtube.com/watch?v=ZnFoVuOVrUQ

祝你好运,剩下的由你决定!

于 2013-07-18T19:30:23.057 回答