问题标签 [speech-to-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
524 浏览

android - 他们有任何适用于 Android 的原始“语音到文本”英文引擎吗?

我想将语音输入转换为英文的原始文本,例如如果我说我的名字“Babu Somasundaram”,那么它应该合成文本,尽管这不在字典中。

是否还有任何在线服务,以便我可以从我的 Android 应用程序发出 HTTP 请求,如果这个未来不被 android 或任何其他第三方 API 原生支持?

提前致谢!

0 投票
4 回答
39716 浏览

java - Android 上的语音转文本

我正在寻找创建一个具有语音到文本的应用程序。

我知道使用 RecognizerIntent 的这种能力:http ://android-developers.blogspot.com/search/label/Speech%20Input

但是 - 我不希望弹出一个新的 Intent,我想在我当前的应用程序中对某些点进行分析,并且我不希望它弹出一些东西,说明它当前正在尝试记录你的声音。

有没有人对如何最好地做到这一点有任何想法。我可能正在考虑尝试 Sphinx 4 - 但我不知道这是否能够在 Android 上运行 - 有没有人有任何建议或经验?!

我想知道我是否可以将此处的代码更改为可能不打扰显示 UI 或按钮而只进行处理:http: //developer.android.com/resources/samples/ApiDemos/src/com/example/android/ apis/app/VoiceRecognition.html

干杯,

0 投票
3 回答
10057 浏览

c# - 使用 System.Speech 将音频文件转换为文本

我正在寻找将通过 android 手机以 16000 录制的 .wav 文件转换为使用 C# 的文本;即 System.Speech 命名空间。我的代码在下面提到;

与示例 .wav “Hello world” 文件完美配合。但是,当我在手机上录制内容并尝试在电脑上转换时,转换后的文本与我录制的内容相差甚远。有什么方法可以确保音频文件被准确转录吗?

0 投票
1 回答
4519 浏览

java - Android SpeechRecognizer 只能在应用程序的主线程中使用

我正在尝试在基于 AndEngine 的游戏中集成一些 Android 语音 API。

我将我的代码放在 BaseGame 活动中 - 但是此错误出现在运行时:

05-06 23:51:28.955: ERROR/AndroidRuntime(553): java.lang.RuntimeException: SpeechRecognizer 只能在应用程序的主线程中使用

如何访问应用程序主线程?以及如何确保我的语音代码在其中运行。

设置如下:

主类 - BaseGameActivity SpeechClass

Main Class 实例化一个新的 SpeechClass + 调用它的方法 - 然后我得到上述错误。

请告知我如何正确地做到这一点。

0 投票
1 回答
1039 浏览

c# - C#中的语音识别

我正在做一个涉及语音识别的项目。但在这里,我不仅需要识别简单的命令,还需要我的应用程序识别冗长的句子。比如“我叫杰克,我住在英国”。我目前正在使用 Microsoft SAPI5.1。但是当我执行我的应用程序时,它并没有准确地说出我所说的。

谁能给我一个更好的选择来完成这项工作。我需要捕捉我所说的并将其转换为文本。请帮忙

0 投票
3 回答
36217 浏览

speech-recognition - 文本到语音(语音生成)和语音到文本(语音识别)API?

是否有适用于桌面或浏览器环境的已知 API 的完整列表?

0 投票
1 回答
3194 浏览

text-to-speech - Linux > Python > TTS、STT 和语音识别

文字转语音

我一直试图在 Windows 和 Linux 环境中运行 pyttsx ......

Linux环境:

python在执行第一行后就挂断了。我已经通过在交互式 shell 提示符下运行这两行来验证上述语句。

窗户环境:

运行完美,并在安装 pyttsx 1.0 win32.exe(从这里)和 pywin 后为我的 windows 版本(从这里)提供所需的输出

所以实际上在我实际上缺乏的Linux版本中???

语音转文本和语音重新定位

那么,pyttsx 可以同时完成这两项任务吗?如果没有,请推荐一些高效的图书馆..

0 投票
2 回答
737 浏览

c# - 语音到文本禁用 Windows 自动处理程序并写下我说的话

我已经开始使用 .NET 语音到文本库 (SpeechRecognizer)

在谷歌搜索和搜索这个网站时,我发现了这个代码示例:

这帮助我开始。我改变了这两行

我的需要

但是,当我说“关闭”时,Windows 的语音识别器会关闭我的应用程序!

此外,有没有比创建自己的字典更好的识别语音的方法?我希望用户说:“给自己写个便条”,然后用户会说话,我会写。

很抱歉在同一个问题上问了 2 个问题,这两个问题似乎都与我的一个问题有关。

0 投票
5 回答
3177 浏览

c# - 使用 C# 语音转文本

我正在尝试使用 C# 语言设计一个文本编辑器,并为普通文件功能实现语音识别,这是否可以实现。如果我重复之前提出的问题,我感到非常抱歉。我只想知道是否有办法使用 C# 将语音转换为文本。你的帮助真的很有价值。等待回复。提前致谢。

0 投票
3 回答
2088 浏览

iphone - 没有互联网的 iPhone 中的大词汇量语音识别?

我使用需要字典的 Openears。当我们在字典中提到这个词时,它很有用。我想转换我们所说的所有单词。所以我用Nuance的语音识别dragaon SDK。但它与网络服务器通信。出于安全考虑,我想避免服务器通信。是否可以将我们所说的所有单词的语音转换为文本,就像在 windows mobile 中一样,而无需仅在离线模式下与服务器通信?