问题标签 [speech-to-text]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 如何在 Microsoft Surface 中使用 Speech 2 文本
我想在我的微软表面应用程序中使用一些语音 2 文本。我看到这是可能的,但我真的不知道从哪里开始。是否有任何可用的框架/库、代码片段或教程?
我什至不知道我应该用谷歌搜索什么;)
===EDIT=== 我读到有必要使用语法来识别单词。因此,如果我想继续自由文本,是否有预定义的英语语法?还是不使用语音2文本而只使用音频文件是更好的选择?
sphinx - Pocketsphinx - 添加单词并提高准确性
我终于成功地构建并运行了 pocketsphinx (pocketsphinx_continuous)。我遇到的问题是如何提高准确性。据我了解,您可以指定一个字典文件(-dict test.dic)。所以我使用了默认的字典文件,并添加了一些相同单词的更多发音,例如:
然而,pocketsphinx 仍然根本无法识别这两个词。我知道您也可以指定一个 jsgf 文件,但这似乎更适用于短语和语法。如何让pocketsphinx 识别铅笔和意大利面条等常用词?
谢谢
-麦克风
android - SpeechRecognizer 导致 ANR...我需要有关 Android 语音 API 的帮助
编辑:我应该已经提到了这一点,但我正在服务中运行此代码。整个应用程序由一个小部件按钮打开/关闭,并且没有任何活动。
更新:我尝试将 SDK 源附加到项目中,以便更准确地了解故障发生的位置,但从外观上看,仅包含公共 API,这似乎使它们不太有用。 . 任何人都可以建议至少一种调试方法来解决这个问题吗?我有点卡住了。
我正在尝试使用 Android 的语音识别包来记录用户语音并将其翻译成文本。不幸的是,当我尝试开始收听时,我收到了一个 ANR 错误,它没有指向任何特定的内容。
正如 SpeechRecognizer API 所指出的,如果您尝试从主线程调用它,则会引发 RuntimeException。这会让我想知道处理是否过于苛刻......但我知道其他应用程序为此目的使用 Android API,而且它通常非常活泼。
java.lang.RuntimeException: SpeechRecognizer should be used only from the application's main thread
这是我试图从我的服务中调用的代码的(修剪)示例。这是正确的方法吗?
感谢您花时间提供帮助。这一直是我无法克服的障碍。
c++ - 使用c++调用和使用Windows语音识别
我正在制作一个涉及使用 Windows 语音识别的应用程序。我正在考虑使用 c++ 来做到这一点,因为我对这种语言有一些经验。我想使用语音识别的方式是让它在内部工作。如果我将音频文件上传到我的程序中,我希望语音识别将此音频写为文本文件,但这一切都应该在内部完成。请为此提供一些帮助,如果我没有正确解释我的问题,请告诉我,我会再次尝试解释。
在此先感谢, divs
python - pyspeech (python) - 转录 mp3 文件?
我想使用 pyspeech API 转录 mp3(语音转文本)。不过,我不知道这是否可能。
是吗?如何?
c# - 语音/语音转文本
我需要一个 API 或库(最好是免费的),它将通过麦克风将语音/语音转换为文本(字符串)。
此外,我将需要一个 API 或库来进行文本到语音的转换。
我想使用 C# 和 .NET,但其他语言就足够了。
谢谢。
android - 有没有办法直接使用 SpeechRecognizer API 进行语音输入?
Android Dev 网站提供了一个使用内置 Google Speech Input Activity 进行语音输入的示例。活动显示带有麦克风的预配置弹出窗口,并使用onActivityResult()
我的问题:有没有办法SpeechRecognizer
直接使用类进行语音输入而不显示预设活动?这将让我为语音输入构建自己的活动。
video - 视频中的 Sphinx4 语音识别
Sphinx4 是否支持对视频文件进行语音到文本处理?如果是,是否需要 JMF?有教程吗??
我找不到任何东西,不在他们的论坛中,也没有人在他们的IRC 频道中回复!
security - 如何将人声转换为数字格式?
我正在开展一个使用生物识别系统来保护系统的项目。我们计划使用人声来保护系统。
想法是让人们说一些单词或句子,系统将以数字格式存储该语音。下次人们想进入系统时,他/她必须说一些可能与之前使用的单词不同或不同的单词。
我们不想匹配单词,但想要匹配语音频率。
我已经阅读了一些关于这个系统的研究论文,但是这些论文没有任何实现细节。
所以只想知道是否有任何软件/API可以将模拟语音转换为数字格式,并且还会告诉我们语音的频率。
到目前为止,我一直在开发普通的基于 Web 的应用程序,所以我知道普通的 API 和平台,如 Java EE、C# 等,但我对这类应用程序没有任何经验。
请赐教!!!