问题标签 [dictation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
352 浏览

r - RStudio 的听写选项

我使用 Dragon NaturallySpeaking 来听写电子邮件和文档以最大程度地减少键盘和鼠标的使用,但除了为某些常见操作(例如“评论”或“设置工作目录”)创建宏之外,还没有找到一种有用的方法来为 RStudio 使用听写。我正在寻找一种方法来通过语音进行至少一些编码本身,承认可能仍然需要一些击键,但任何最小化都会有所帮助。

在搜索其他论坛时,我遇到了 VoiceCode,这可能是一种解决方案,但目前仅适用于 Mac,并且由于各种原因我在 Windows 上。我还看到了 Vocola,它似乎是一种用于编写宏的脚本语言,但不确定这是否会有所帮助。

任何建议将不胜感激。

布莱恩

0 投票
0 回答
173 浏览

ios - 本地语音框架 API,无需网络连接

我试图弄清楚。某些 iOS 设备上的听写似乎完全没有 inet 连接。因此,即使我禁用了移动数据和 Wifi,iOS 键盘上也可以使用麦克风图标。

在某些设备上设置 -> 常规 -> 键盘看起来像这样:

在此处输入图像描述

在某些设备上,它看起来像这样:

在此处输入图像描述

两款设备均使用 iOS 10.2.1 版本。第一个屏幕来自 iPhone 6s+,第二个屏幕来自 iPhone 6。有人知道哪些设备支持此功能吗?是否有关于此主题的任何官方 Apple 信息。我的目标是让它在没有 inet 连接的情况下工作,并使用没有 inet 连接的语音框架来识别语音。

0 投票
0 回答
24 浏览

macos - 通过语音听写选择链接

我一直有一些 RSI 问题,我正在尝试尽可能多地使用语音控制来帮助我的身体。我在系统导航和在 macos 上输入文本方面做得很好,但网页浏览仍然是成功的一半。我可以创建新标签、搜索文本等等。缺少的链接是通过 Chrome 中的语音选择和单击链接的能力。这可能吗?谢谢!

0 投票
2 回答
12101 浏览

python - 让 Python 语音识别更快

我一直在使用 Google Speech Recognition for Python。这是我的代码:

虽然识别非常准确,但需要大约 4-5 秒才能吐出识别出的文字。由于我正在创建语音助手,因此我想修改上面的代码以使语音识别更快。

有什么办法可以将这个数字降低到大约 1-2 秒?如果可能的话,我会尝试像 Siri 和 Ok Google 等服务一样快速识别。

我对python很陌生,所以如果我的问题有一个简单的答案,我深表歉意。

0 投票
1 回答
47 浏览

android - EditText 中的标点符号 - Android Nougat

为什么标点符号不适用于 EditText 上的语音识别?我正在使用英语和波兰语口述 - 在两种语言中标点符号都不起作用。我尝试了“逗号”、“感叹号”、“句号”、“问号”和波兰语等价物——所有这些都被识别为普通文本,如“逗号”等。

我有最新的 GBoard 键盘、系统版本(Android Nougat)。问题出在哪里?

0 投票
0 回答
100 浏览

c# - 听写不适用于我的 WPF 应用程序 - 需要建议

尝试使用免费的口述单词进行语音识别。但这对我不起作用。也许有人可以看看。

从这里开始:

这是逻辑:

该代码来自微软网站,但我无法将其集成以获取输出。不幸的是,什么也没有发生。

我能做些什么?

0 投票
0 回答
51 浏览

c# - 如何在 wpf 应用程序上使用 DictationRecognizer()?

它适用于团结。我需要使用 wpf,但是当在这里尝试使用 wpf 时,无法识别 Dictatoin 识别器,尽管语音程序集已链接。

我需要一种简单的方法来在 wpf 上使用以下/等效项:

DictationRecognizer dictationRecognizer = new DictationRecognizer();//not recognized.

您能为此推荐一种方法/解决方案吗?

0 投票
1 回答
2788 浏览

ios - M4A 音频文件转换为 MP3 或 WAV

我为口述报告的医生开发了一个本地 IOS 应用程序。目前音频文件以 m4a 格式提供。但是在我们的服务器上接受 mp3 或 wav 音频文件。在将录音发送到听写服务器之前,在 IOS 设备中转换 m4a 文件的最佳方法是什么?

0 投票
1 回答
258 浏览

java - 使用 Sphinx4 和 Python 实现听写系统

我想使用 Sphinx4 开发一个听写系统。经过一番搜索,我意识到最好使用的语言是Java。我可以将 Sphinx4 与 Python 结合起来吗?我更喜欢 Python,因为我想通过在语言模型中添加神经网络技术并应用领域分类来增强我的系统。另外,我阅读了有关袖珍狮身人面像和 pypi 的文章,但据说袖珍狮身人面像用于便携式轻量级应用程序,而我的应用程序将在云上运行,并且我将有足够的计算能力来支持更好的模型。

0 投票
1 回答
416 浏览

unity3d - 如何在 Unity 中同时运行听写识别器时访问麦克风数据?

您好我正在使用 DictationRecognizer 类在我的项目中添加语音输入功能。我按照这个https://docs.microsoft.com/en-us/windows/mixed-reality/voice-input-in-unity来实现听写识别器并且它可以工作。

但是,在我的应用程序中,我想包含一个基于实时麦克风数据量的动画。每当麦克风开始获取语音数据时,我想在 unity 内运行一个小动画来指示麦克风正在录音。听写识别器运行时是否可行?任何帮助表示赞赏!