问题标签 [voice-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
voice-recognition - Julius 的语音识别。如何制作 .voca 文件?
我正在制作一个语音识别系统,Julius 在这项工作中显示出不错的结果。示例 .voca 文件中的单词可以完美识别,但如何将自己的单词和转录内容放入文件中?
我已经尝试过 VoxForge ( http://www.voxforge.org/ ) 的最新版本,并使用他们的词汇表为声学模型进行夜间构建,但我在 julius 开始时遇到了很多错误,如下所示:
有人知道 .voca 文件的单词转录规则吗?
voice-recognition - 带有翻译的应用程序
我有一个需要语音识别翻译器的应用程序的想法。我希望能够用几种选定的语言说话,并让应用程序将其翻译成屏幕上的英文文本。我知道这样的应用程序已经存在,但我的应用程序有一个特殊的优势,可以让它盈利。
基本上我的问题是......我如何获得翻译的编码?有没有开源的?有没有我可以支付许可费的现有的?无需付费从头开始构建语音翻译器的最佳方式是什么?
voice-recognition - 我需要一个应用程序的语音翻译器和翻译器......我该去哪里?
有谁知道我在哪里可以找到可以在应用程序上使用的语音翻译器和翻译器?我想要翻译成文本的几种语言的语音识别。我在哪里可以找到这个或者我应该从哪里开始?我是一个菜鸟,所以任何帮助表示赞赏。
android - 调用 android.speech.RecognizerIntent API 导致连接错误对话框,在日志中显示“calling_package”警告
我编写了一个小应用程序,允许用户通过按钮选择他使用语音搜索的语言,而不是依赖用户的语言偏好(有时您希望在不将整个 UI 切换为日语的情况下用日语进行语音搜索)。
我正在我的 HTC Desire /Android 2.1 (Softbank-x06ht) 上测试该应用程序。但是,当我调用语音 api 时,我得到一个“连接失败”对话框 [重试/取消],并且 LogCat 显示此警告:
请注意,我可以使用 Google Voice Search 应用程序,它可以正常工作。
根据 API Docs http://developer.android.com/reference/android/speech/RecognizerIntent.html#EXTRA_CALLING_PACKAGE开发人员不能使用calling_package 参数。好吧,如果是这样,为什么日志说它丢失了?
我试图自己提供参数,但它根本没有改变结果。
android - 为 Android 中的新“Listen To”动作而开发
我正在完成 Android 应用程序的开发,以便在时间允许的情况下使用 DAAP 和 UPnP 以及其他协议从您的个人音乐收藏中流式传输音乐。
我的问题是:如何让我的应用程序响应 Android 中新的“听”语音命令?
我找遍了整个地方,无法弄清楚。
我假设它是一个广播接收器,但对于我的生活,我找不到哪一个。
任何帮助深表感谢。
sms - Twilio、Tropo - 短信和语音应用还有谁?
到目前为止,我已经找到了 Twilio 和 Tropo 来帮助 SMS 和语音应用程序的服务。
还有其他人吗?
我主要对实时语音识别感兴趣(即用户可以说话,系统可以基于此做出响应)。
另外,如果有人知道语音识别质量是什么样的,那会有所帮助!
web-applications - 您如何从网络应用程序中识别语音
我想要一些非常简单的东西来识别一个词(“UNO!”)
android - 在“onCreate”方法中调用的 Android 语音识别活动导致应用加载缓慢
在我的 android 应用程序中,我在启动活动的 onCreate 方法中调用语音识别。我已经优先选择是否启动语音控制。但是,当语音识别开启时,应用程序大约需要 5-7 秒才能加载。当它关闭时,应用程序几乎立即启动。下面是示例代码,我添加了 Free_Form、max_results 1 和自定义提示。
所以我真的有两个问题:
startActivity(intent) 不是在单独的线程中运行吗?
为什么在我的 OnCreate 方法中调用普通的 android 语音识别需要很长时间才能加载?
android - Android 2.2.1 Nexus one:语音识别问题
嗨伙计,
我在具有固件的 Google Nexus 一部手机上的语音识别有一个奇怪的问题:2.2.1。语音识别对口语进行多种解释当我对语音识别说“你好”时,收到的结果是“你好,酒店,照片,fomdem,本田”,预计只会出现“你好”同样的事情在固件 2.1 上运行良好,结果令人满意。
必须做些什么来避免这个问题。任何建议都是有帮助的
最好的问候, 维纳亚克
android - Android中的语音活动检测
我正在编写一个应用程序,其行为类似于现有的语音识别,但会将声音数据发送到专有的 Web 服务以执行语音识别部分。我正在使用标准的 MediaRecord(它是 AMR-NB 编码的),它似乎非常适合语音识别。唯一提供的数据是通过getMaxAmplitude()方法提供的 Amplitude。
我正在尝试检测此人何时开始说话,以便当此人停止说话约 2 秒钟时,我可以继续将声音数据发送到 Web 服务。现在我正在使用一个幅度阈值,如果它超过一个值(即 1500),那么我假设这个人正在说话。我担心的是幅度级别可能因设备(即 Nexus One v Droid)而异,因此我正在寻找一种更标准的方法,可以从幅度值中得出。
PS我查看了graphing-amplitude,但它没有提供仅使用幅度的方法。