问题标签 [voice-detection]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - Google Speech API - 有没有办法确定音频是否有人声?
我正在制作一个音频过滤应用程序,它可以读取数百个音频文件并对其进行过滤。因此,如果音频中有人声,它将接受它,如果没有,它将删除音频文件。
我正在使用 ffmpeg 来获取音频的详细信息并添加其他过滤器,例如大小和持续时间以及静音(尽管它在检测所有音频文件的静音方面不是很准确。)
我的公司要求我尝试使用 Google Cloud Speech API 来检测音频中是否有任何人声。
因此,使用此代码,一些音频文件会在音频文件中返回口语单词的转录,但我需要确定是否有人在说话。
我考虑过使用hark.js,但似乎没有足够的文档,而且我的时间很短!
附言。我是一名实习生,我刚开始编程。如果我的问题没有意义或听起来很愚蠢,我深表歉意。
android - 如何在 Android 中将 Short[] 写入 wav 输出文件?
我正在尝试使用文件输出流将 Short[] 写入 wav 音频文件,但该文件仅包含刮擦声。我使用 short[] 而不是 byte[] 的原因是因为我正在尝试使用提供Voice Activity Detection的外部库。我确实将Android 音频记录中提供的 wav 标头添加到 wav并且我尝试使用将 Short 数组从音频记录转换为字节数组将 Short [] 转换为 byte [] 而不会降低音频质量?但以上链接都无法帮助我。这是我的代码:
javascript - Web Audio API:我如何检测语音并录制直到静音,有或没有一键通按钮
MediaRecorder
我正在使用API成功运行充当语音消息发送者的客户端网页:
- 当用户按任意键时,开始录音,
- 当按键被释放时,录音会通过 soketio 发送到服务器进行进一步处理。
这是一种PTT(一键通)用户体验,用户只需按下一个键(推)即可激活语音记录。之后他必须松开按键以停止录制,触发消息发送到服务器。
这是我使用的一个javascript代码块:
现在,我想要的是激活/停用音频(语音)录制,不仅可以通过网页按钮/按键/触摸,还可以通过外部硬件麦克风(带有一键通按钮)。更准确地说,我想用耳罩上的 PTT 按钮连接工业耳机,见图:
顺便说一句,该PTT
按钮只是一个物理按钮,用作短路拨动开关,如图所示,仅作为示例:
- 默认情况下,麦克风接地,输入信号 == 0
- 当
PTT
按下按钮时,微被激活并输入信号!= 0。
现在我的问题是:如何使用 Web Audio API 来检测何时按下 PTT 按钮(因此音频信号 > 0)来执行mediaRecorder.start()
?
在这里阅读:我想我必须使用返回的流mediaDevices.getUserMedia
并创建一个AudioContext()
处理器:
但是该processor.onaudioprocess
函数必须做什么才能启动(volume > DELTA)和停止(volume < DELTA)MediaRecorder?
我想音量检测可能对两种情况有用:
- 使用
PTT
按钮,用户明确决定演讲的持续时间,按下和释放按钮 - 没有
PTT
按钮,在这种情况下,语音消息是使用所谓的VOX
模式(连续音频处理)创建的
任何想法?
flutter - 可以用语音打开flutter应用吗?
我正在开发一个帮助盲人找东西的应用程序,我想在应用程序中添加语音操作的功能,例如,当用户说“打开”时,应用程序将午餐
javascript - 使用 Nodejs 进行语音和音乐检测
我目前正在使用 chrome 扩展程序,可以取消在浏览器中播放的视频的背景音乐。我在这个论坛上发现了一种检测浏览器是否正在播放音乐的方法(第一步),它可以在浏览器上运行,但实际上不能用于扩展。所以我想知道是否有人知道可以检测浏览器声音的节点包。同样,如果有人知道一个包可以从视频(在 JS 中)中“拆分”音乐和语音,我很感兴趣。
祝你有美好的一天!