2

我正在开发一个可以检测某些关键词的应用程序。我一直在使用谷歌的网络语音。

我能够记录用户的声音并将其打印出来,但我希望能够检测到某些单词。

我似乎找不到这样做的方法。我发现了这个问题Detecting known words using the Web Speech API,但它链接到的答案中的站点已经消失。

任何人都可以对此有所了解吗?任何帮助都会很棒。干杯! 这是一个小提琴

  var recognition = new webkitSpeechRecognition(); // google voice recognition start

  recognition.continuous = true; //so that recognition will continue even if the user pauses while speaking


  document.getElementById('startSpeech').addEventListener('click', function() {
   startSpeech();
 });
  document.getElementById('stopRecognizing').addEventListener('click', function() {
      stopRecognizing();
  });


  var startSpeech = function(){

  var lang = ['en-GB', 'United Kingdom'];
  final_transcript = '';
    recognition.lang =  recognition.lang
    recognition.start() //activates the speech recognizer
  }

  var stopRecognizing = function(){
   recognition.stop();//stops the mic from listening
   return;
  }  


 recognition.onresult = function(event) {
 console.log('event', event);
 // This handler concatenates all
 // the results received so far into two strings  final_transcript & interim_transcript

var interim_transcript = '';

for (var i = event.resultIndex; i < event.results.length; ++i) {
  if (event.results[i].isFinal) {
    final_transcript += event.results[i][0].transcript;
  } else {
    interim_transcript += event.results[i][0].transcript;
  }
}
//final_transcript = capitalize(final_transcript);
    final_span.innerHTML = linebreak(final_transcript);
    interim_span.innerHTML = linebreak(interim_transcript);

    // console.log('final_transcript' , typeof final_transcript);
    // console.log('interim_transcript' , interim_transcript);

    if (final_transcript.length > 0) {
        matchingKeyWords(final_transcript);
    }
};

      function linebreak(s) {
    var two_line = /\n\n/g;
    var one_line = /\n/g;
    return s.replace(two_line, '<p></p>').replace(one_line, '<br>');
}

function capitalize(s) {
    var first_char = /\S/;
    return s.replace(first_char, function(m) { return m.toUpperCase(); });
}


        var matchingKeyWords = function(conversation){

    var keyWords = ['power', 'tie', 'imaginary' ,'bomb', 'drink', 'underwear', 'chance', 'type', 'historical',
        'society' ,'collect' ,'sugar']

        for (var i = 0; i < keyWords.length; ++i) {
            console.log(conversation[0]);
            if (conversation === keyWords[1]) {
                console.log('hit');
            }
            // console.log('keyWords[i]', keyWords[i]);
        }
}
4

3 回答 3

2

您绝对不能以任何方式修改 API 来附加字典或影响结果。

但是,您可以将结果归结为语音上相似的单词,以影响您的代码的解释。

目前,您似乎正在为某些单词执行“精确”匹配。因此,如果引擎认为它听到的是“Thai”而不是“Tie”......该结果将不会产生匹配。

解决方案是在匹配逻辑中添加“模糊性”。您是否考虑过像FuzzySet.js这样的库?

您可以通过搜索“模糊字符串匹配 JS”或“语音相似 JS”之类的内容找到更多示例

于 2016-07-05T16:28:12.410 回答
1

在 for 循环内的 matchingKeyWords 函数中,请将 keyWords[1] 更改为 keyWords[i] 然后尝试。还将if条件更改为

if(conversation.indexof(keyWords[i]) > -1)
于 2016-10-03T14:01:49.567 回答
1

我看到这个问题已经有八个月了,你可能已经找到了答案,但万一其他人还在寻找——我认为你需要给应用程序一些“语法”来检查,如下所示:

var colors = [ 'aqua' , 'azure' , 'beige', 'bisque', 'black', 'blue', 'brown', 'chocolate', 'coral' ... ];
var grammar = '#JSGF V1.0; grammar colors; public <color> = ' + colors.join(' | ') + ' ;'

MDN 有一个 Web Speech API 的演示,它类似于您正在尝试做的事情(如果我理解正确的话)。你大声朗读一个短语,它会告诉你它是否被理解。

http://mdn.github.io/web-speech-api/phrase-matcher/

于 2017-03-10T05:06:53.690 回答