我用 Angular/websockets/node js 和谷歌语音转文本 api 构建了一个语音识别系统。
我在几乎所有单词上都表现得很好,但是“no”这个词确实存在问题 - 似乎“no”这个词甚至没有传递给 API,因为没有中间结果发生。对于诸如“是”之类的词、更长的词或偶数(1、2、3 等)不会出现此问题。
IE th .on('data', (data) => {
ofstreamingRecognise
什么都不输出 - 似乎直到它“听到”诸如“是”、“你好”等词,但不是“不”而没有很多 umph。
有任何想法吗?
配置:
sampleRateHertz = 48000;
languageCode = 'en-US';
single_utterance = true; // Processes after short sound burst (sentence/word)
interimResults = true; // Reports back findings mid-sentence. Useful for "processing" UI
metadata = {
microphoneDistance: 'NEARFIELD',
interactionType: 'VOICE_SEARCH',
recordingDeviceType: 'PC',
};```