问题标签 [webspeech-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - 网络语音 API in_array
如果有这个代码,它就像魅力一样工作,但在第一个结果之后 in_array 函数只给我“假”。我找不到问题。每次我重新开始识别,它只适用于一个短语......
用于测试 jsfiddle:http: //jsfiddle.net/p3Fxc/
javascript - Web Speech 使 Safari iOS 崩溃
我在 Mobile Safari 中使用语音合成,发现它非常不稳定,特别是在说话过程中操纵 DOM 时。我创建了一个简单的测试用例,它在 iPad 上的 iOS 7.1.1 上使 Safari(或 Webview)崩溃(但在 OS X Safari 上运行良好)。有谁知道为什么下面的 HTML 页面会杀死移动 Safari?
javascript - Web Speech API 延迟时间——如何解决?
我在网页中使用 Web Speech API。但是,我发现返回结果需要 3-5 秒,这在当今的网络世界中是很多滞后时间。有没有其他人有这个问题?有没有人找到解决方案?
这是迄今为止我所拥有的准系统——它本身可以工作,但我需要它更快。
node.js - 在 Google Chrome 中使用 Web Speech API 实现来规避标准 API 的速率限制?
要直接使用 Google 的语音 API,现在需要您获取 API 密钥。要获得该密钥,您必须订阅 chromium-dev@chromium.org 新闻组,然后按照几个步骤操作,Google 将为您提供一个“不用于分发”的开发人员密钥。关键是每天 50 个请求的速率限制。
例如,node-google-speech-api 概述了节点应用程序需要此密钥才能直接访问 Google 的语音 API(不使用浏览器): https ://github.com/psirenny/node-google-语音API
还有用于访问 Google 语音 API 的 PHP 库和 Java 库,也需要此密钥。
我想编写一个利用谷歌语音识别技术的桌面应用程序,但是对于广泛分发甚至我设想的软件的单一桌面部署来说,每天 50 个请求的限制是不可接受的。如果语音识别以某种方式中断,我会看到个人桌面用户每天最多 500 个请求,其中大多数可能是长时间轮询/连续的,所以可能每天只有 2 或 3 个请求,但几个小时一次。将其乘以几百个用户,我每天很容易超过 50 个请求。
我试图想办法在我自己的应用程序中在桌面上访问谷歌卓越的语音识别技术(语言无关紧要,但 node.js 可能是其中的一部分,因此首选 node.js 解决方案)这个限制让我开始考虑 Google Chrome 恰好实现的 Web Speech API 标准。
据我所知,Google Chrome 对 Web Speech API 的实现没有硬性请求/天限制,与 Google Speech API 相比,我可以愉快地编写整天使用 Web Speech API 的网站,而不受限制或限制最少直接的。这让我想到,如果我分发一个 Chrome(不是 Chromium)浏览器,那么真正的 Google Chrome 浏览器,但添加了一个“扩展”,允许自定义 html5 网页中的 javascript 与客户端上的其他应用程序交互系统(即与这个特殊的 Chrome 安装一起运行的 Node.js 应用程序)并以 Javascript、Web Speech API 样式编写我的语音识别部分,并将输出通过管道传输到我设计并安装在客户系统上的另一个应用程序中。
那会/可以吗?
这种方法的缺陷是什么?
您是否有其他方法的建议,或者您可能会推荐一种商业许可的解决方案,该解决方案可与 Google 语音技术的易用性和极高的自然语言准确性相媲美?
speech-synthesis - 语音合成 API 音量、速率和音高不起作用
长话短说,语音合成的音量、速率和音高不起作用。有没有其他人有这个问题并且知道如何解决它,或者我一个人?
长话短说:
对我来说,语音合成的音量、速率和音高不起作用。这是我的语音功能:
但是,当我调用speak("Hello", 0, 0, 0.1)
它时,它的输出与speak("Hello")
. 我想让它输出相同但更柔和的东西。
我目前正在关注http://updates.html5rocks.com/2014/01/Web-apps-that-talk---Introduction-to-the-Speech-Synthesis-API。
javascript - webkitSpeechRecognition 在收集结果时“落后”
很想尝试Web Speech API。我完全从文章中复制了代码,我遇到了你说话的问题,但是在你再次说话之前什么都没有发生。
[小提琴:http: //jsfiddle.net/w75v2tm5/ ]
JS:
例如,如果我说“Hello world”,我设置的显示结果的 <div> 不会显示“Hello world”,直到我说其他话或发出声音。但是,如果我说其他话,直到我再次说其他话时才会显示。
变量“final_transcript”保存的是 PREVIOUS 结果,而不是我刚才所说的。只差1点。
为了给你一个更好的主意...
我:“你好世界”
final_transcript = '';
[等待...]
我:“测试”
final_transcript = '你好世界'
这只是继续。代码无法按照我所说的那样转录我所说的内容。很奇怪。
关于为什么会这样的任何想法?
javascript - Web Speech API 是否有运行时限制
我在自己的环境中对此进行了测试,但您可以在此处查看 Google 示例中的症状
口述讲话时,结果将持续返回大约一两分钟。在那之后,不会有更多的onresult
事件发生。虽然没有发生可检测到的错误,并且onend
事件尚未触发。
只有当我停止听写并等待某种超时时,我才会得到onend
事件。
如何将识别设置为运行更长时间的连续听写?
同样,这可以在 Google 的示例中复制,所以我认为这不是我的代码的具体问题
javascript - 仅网络语音 API 数字
我正在编写一个需要我识别口语数字的网络应用程序。我正在使用 javascript Web Speech API。目前它工作得很好,但我很想将识别限制在数字范围内,以提高准确性。我的一个想法是设置语法,但我一生都无法弄清楚如何设置。有人知道如何进行此限制吗?
javascript - JavaScript Web Speech API 何时使用 .start() 而不是 .speechstart()?
我正在尝试使用 Web Speech API 创建一个 Web 应用程序,用户在开始时单击一个按钮来开始语音录制。我试图让它在用户停止说话时自动停止,然后我想使用谷歌翻译 API 来翻译用户的语音。我已经包含了我遇到问题的 Web Speech 部分的代码。
javascript - 如何在不重复权限信息栏的情况下继续在 Web Speech API 中识别?
我对Web Speech API有点困惑:也就是说,我还没有弄清楚如何逐步处理识别。
假设我有三个输入:
我想识别三个输入词,每次识别后将焦点转移到下一个输入。这可以使用现有的API吗?我看过的教程(比如这个好像需要反复点击权限栏,超级烦人。
有什么方法可以设置对每个页面加载的麦克风的访问权限或类似的东西?