问题标签 [speech-to-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
456 浏览

c# - 如何在 Microsoft Surface 中使用 Speech 2 文本

我想在我的微软表面应用程序中使用一些语音 2 文本。我看到这是可能的,但我真的不知道从哪里开始。是否有任何可用的框架/库、代码片段或教程?

我什至不知道我应该用谷歌搜索什么;)

===EDIT=== 我读到有必要使用语法来识别单词。因此,如果我想继续自由文本,是否有预定义的英语语法?还是不使用语音2文本而只使用音频文件是更好的选择?

0 投票
6 回答
20886 浏览

sphinx - Pocketsphinx - 添加单词并提高准确性

我终于成功地构建并运行了 pocketsphinx (pocketsphinx_continuous)。我遇到的问题是如何提高准确性。据我了解,您可以指定一个字典文件(-dict test.dic)。所以我使用了默认的字典文件,并添加了一些相同单词的更多发音,例如:

然而,pocketsphinx 仍然根本无法识别这两个词。我知道您也可以指定一个 jsgf 文件,但这似乎更适用于短语和语法。如何让pocketsphinx 识别铅笔和意大利面条等常用词?

谢谢

-麦克风

0 投票
6 回答
19080 浏览

android - SpeechRecognizer 导致 ANR...我需要有关 Android 语音 API 的帮助

编辑:我应该已经提到了这一点,但我正在服务中运行此代码。整个应用程序由一个小部件按钮打开/关闭,并且没有任何活动。


更新:我尝试将 SDK 源附加到项目中,以便更准确地了解故障发生的位置,但从外观上看,仅包含公共 API,这似乎使它们不太有用。 . 任何人都可以建议至少一种调试方法来解决这个问题吗?我有点卡住了。


我正在尝试使用 Android 的语音识别包来记录用户语音并将其翻译成文本。不幸的是,当我尝试开始收听时,我收到了一个 ANR 错误,它没有指向任何特定的内容。

正如 SpeechRecognizer API 所指出的,如果您尝试从主线程调用它,则会引发 RuntimeException。这会让我想知道处理是否过于苛刻......但我知道其他应用程序为此目的使用 Android API,而且它通常非常活泼。

java.lang.RuntimeException: SpeechRecognizer should be used only from the application's main thread

这是我试图从我的服务中调用的代码的(修剪)示例。这是正确的方法吗?

感谢您花时间提供帮助。这一直是我无法克服的障碍。

0 投票
2 回答
12501 浏览

c++ - 使用c++调用和使用Windows语音识别

我正在制作一个涉及使用 Windows 语音识别的应用程序。我正在考虑使用 c++ 来做到这一点,因为我对这种语言有一些经验。我想使用语音识别的方式是让它在内部工作。如果我将音频文件上传到我的程序中,我希望语音识别将此音频写为文本文件,但这一切都应该在内部完成。请为此提供一些帮助,如果我没有正确解释我的问题,请告诉我,我会再次尝试解释。

在此先感谢, divs

0 投票
2 回答
6976 浏览

python - pyspeech (python) - 转录 mp3 文件?

我想使用 pyspeech API 转录 mp3(语音转文本)。不过,我不知道这是否可能。

是吗?如何?

0 投票
6 回答
45439 浏览

c# - 语音/语音转文本

我需要一个 API 或库(最好是免费的),它将通过麦克风将语音/语音转换为文本(字符串)。

此外,我将需要一个 API 或库来进行文本到语音的转换。

我想使用 C# 和 .NET,但其他语言就足够了。

谢谢。

0 投票
1 回答
293 浏览

java - 我可以使用 freetts 从音频输入中检测特定的声音吗?

我可以使用freetts进行语音到文本转换之类的操作吗?

我需要从笔记本电脑的音频输入中检测特定的声音,我可以通过 java 中的freetts来做到这一点吗?

0 投票
5 回答
33722 浏览

android - 有没有办法直接使用 SpeechRecognizer API 进行语音输入?

Android Dev 网站提供了一个使用内置 Google Speech Input Activity 进行语音输入的示例。活动显示带有麦克风的预配置弹出窗口,并使用onActivityResult()

我的问题:有没有办法SpeechRecognizer直接使用类进行语音输入而不显示预设活动?这将让我为语音输入构建自己的活动。

0 投票
1 回答
752 浏览

video - 视频中的 Sphinx4 语音识别

Sphinx4 是否支持对视频文件进行语音到文本处理?如果是,是否需要 JMF?有教程吗??

我找不到任何东西,不在他们的论坛中,也没有人在他们的IRC 频道中回复!

0 投票
3 回答
4475 浏览

security - 如何将人声转换为数字格式?

我正在开展一个使用生物识别系统来保护系统的项目。我们计划使用人声来保护系统。

想法是让人们说一些单词或句子,系统将以数字格式存储该语音。下次人们想进入系统时,他/她必须说一些可能与之前使用的单词不同或不同的单词。

我们不想匹配单词,但想要匹配语音频率。

我已经阅读了一些关于这个系统的研究论文,但是这些论文没有任何实现细节。

所以只想知道是否有任何软件/API可以将模拟语音转换为数字格式,并且还会告诉我们语音的频率。

到目前为止,我一直在开发普通的基于 Web 的应用程序,所以我知道普通的 API 和平台,如 Java EE、C# 等,但我对这类应用程序没有任何经验。

请赐教!!!