问题标签 [voice]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - Python 中的 VoIP,然后是 http
您好,我想知道是否可以在 python 中制作一个 voip 脚本,然后如果它可以在我的网站上在线集成它,谢谢
asp.net - ASP.NET 语音识别应用程序
. 亲爱的大家, 我们正在开发一个 ASP.NET 语音识别项目。该应用程序主要旨在培训最终用户的英语语言。在这里,我们需要捕捉登录用户对显示图像所说的话的声音。
例如,当我们在网页中显示一个人驾驶汽车的图像时,我们需要捕获并发送用户“一个人在驾驶汽车”的录制语音到服务器。
在此之后,在服务器端,我们需要将此语音转换为文本,然后与数据库文本“A man isdriving a car”进行比较。如果两者都匹配,则用户获得 1 分,否则获得 0 分。
那么请您指导我们如何进行此应用程序的开发。参考链接会有很大帮助。
非常感谢,问候 Anupriya。.
android - Android中的语音活动检测
我正在编写一个应用程序,其行为类似于现有的语音识别,但会将声音数据发送到专有的 Web 服务以执行语音识别部分。我正在使用标准的 MediaRecord(它是 AMR-NB 编码的),它似乎非常适合语音识别。唯一提供的数据是通过getMaxAmplitude()方法提供的 Amplitude。
我正在尝试检测此人何时开始说话,以便当此人停止说话约 2 秒钟时,我可以继续将声音数据发送到 Web 服务。现在我正在使用一个幅度阈值,如果它超过一个值(即 1500),那么我假设这个人正在说话。我担心的是幅度级别可能因设备(即 Nexus One v Droid)而异,因此我正在寻找一种更标准的方法,可以从幅度值中得出。
PS我查看了graphing-amplitude,但它没有提供仅使用幅度的方法。
java - 通过蓝牙在电话上即时和远程计算机语音?
您是否认为可以通过蓝牙连接在基于 Java 的手机上在计算机上播放电影或其他内容并立即远程听到视频的声音?
手机和电脑之间的蓝牙连接速度大约是 40 KB/s,对于语音传输来说已经足够了。但是我找不到任何可以做到这一点的软件。请有人给我有关我希望的可能性的信息。
web-applications - Web 浏览器中的语音识别
如何通过 Web 浏览器界面实现在线语音识别。
是否可以在不使用任何流服务器(完全基于浏览器的应用程序)的情况下实现这一点?不构建任何自己的插件,是否可以使用 Flash 实现语音识别...
c++ - 预测语音包 (speex/ilbc c++)
一段时间以来,我一直在使用 gsm 编解码器进行网络音频聊天。由于“语音预测”,现在我想实现像 speex 或 iLBC 这样的东西。据我了解,我需要数据包的时间戳。我也知道要使编解码器预测语音,例如,我必须将其传递为 NULL 数据包。
但我无法理解整个概念!即:App发送数据包1,2,3,4,5,6。我收到 1,2,3,6。我必须做什么?
接收 1 - 播放它。
接收 2 - 播放它。
接收 3 - 播放它。
接收 6 - 嗯...播放 4,5 作为 NULL 然后播放 6?
如果丢失的数据包太多怎么办?
java - 在 Flash 项目中集成 .jar
我必须将 .jar 文件集成到 Flash 项目中。项目是这样的:
将有一个带有播放、暂停、停止命令的网络浏览器的 Flash 视频播放器。我必须使用语音命令来触发玩家动作。我有一个可以进行语音识别的 .jar,所以我想将此文件与我的 Flash Player 集成。
这可能吗?
PS:你可能想知道为什么我不使用其他工具,但这是一个大学的项目,有给定的材料,所以我真的需要使用 Flash +这个给定的 .jar 。
ruby-on-rails - 需要一个可以集成到 Rails 应用程序中的多用户语音聊天应用程序
是否有任何 Rails 插件可用于多个用户之间的语音聊天?或者可以与 rails 应用程序集成的任何其他语言的多用户语音聊天应用程序?
急切地等待帮助。
macos - MacOS 上的文本转语音语音
是否有任何关于 Apple 用于保存文本到语音的格式的文档?是否有任何应用程序已经可以产生这样的声音?我猜大部分信息都包含在文件“PCMwave”中,但我无法弄清楚结构可能是什么。
python - 谷歌语音 API
有没有办法使用 pygooglevoice 提取转录语音邮件的文本?打印消息只是打印文件名。