有两个语音样本(wav 或 mp3)。需要比较两者并设置一些比较系数。
它需要像罗塞塔石碑一样训练发音。
首选 .net 的库。
从 .NET Framework 中的 System.Speech 库开始:http: //msdn.microsoft.com/en-us/library/gg145021.aspx
此页面显示如何使用 Synthesis 说话,以及 Recognition 来聆听和识别用户在说什么: http ://www.mperfect.net/speechSamples/