我尝试编写一个可以测试用户发音的程序。
该程序将播放一个波形声音,说一个英语句子,用户将尝试发音并记录他的声音,程序将检查该波形的相似性并指出用户的发音。
问题是,是否可以使用 .net 编写此程序?如果是,我可以使用哪些库?有什么指南可以开始吗?
音乐识别程序通常表示频谱域中的声音(如捕捉音高)。
根据一些光谱表示,可以使用距离测量(欧几里得或其他)。
对于语音,时间维度是必要的。
在空间域中,考虑时间变形(慢与快)的翘曲测量似乎也是一个不错的选择。
模板匹配算法和 OCR 算法一样可能是很好的候选者,但现在您将处理声波。
声波算法的一个常见考虑因素是滑动窗口或分割。
梅苏特!
假设您使用的是 C#.NET,我可能会为您解答。一个简单的 Google 搜索让我看到了这个 YouTube 视频,它向您展示了如何“绘制音频波形”:http ://www.youtube.com/watch?v=ZnFoVuOVrUQ
祝你好运,剩下的由你决定!