问题标签 [speech-to-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
1434 浏览

speech-recognition - 嵌入式应用的语音识别引擎

我正在尝试研究可用的语音识别引擎和 SDK,以开发支持 Windows CE 语音的应用程序。我遇到过 Nuance,但没有看到太多其他东西。如果可能的话,我更喜欢 .Net SDK,但我想大多数都是 C/C++。我很感激任何建议。谢谢。

0 投票
1 回答
229 浏览

speech-recognition - 如何在识别之前获取输入语音

如何在识别之前获取输入语音。例如,如果我说“hel”,但它在字典中找不到它。或者它认为它是另一个词。我只想得到“地狱”

0 投票
4 回答
2065 浏览

iphone - 如何在iphone中将语音转换为文本?

我想构建一个应用程序,当用户在 iphone 上交谈时,它将转换为相应的文本。

我听说在windows平台上是可以的。

这在 iphone 中是否可行?有任何可用的 API 吗?

0 投票
1 回答
355 浏览

.net - 自定义 .net 应用程序的语音转文本注意事项

我是一个 .Net 3.5 WinForm 应用程序,仅用于内部数据输入。主要是各种形式的文本框等。使用 Windows 7 语音识别,它似乎对我的应用程序“开箱即用”。

我想知道的是这是否完全正确。我需要采取哪些步骤来确保我的应用程序具有最高级别的可用性?它是否使用 UI 元素的标签或其他东西。

我需要包括这里讨论的内容System.Speech.Recognition Namespace

任何指导或建议将不胜感激。首先,如何给一个元素一个特定的语音识别句柄。

0 投票
3 回答
5449 浏览

c# - System.Speech.Recognition 选择识别配置文件

有谁知道如何从 .NET 应用程序中更改识别配置文件?

我正在编写一个使用 System.Speech.Recognition 命名空间中的功能进行语音识别的 .NET 应用程序。我输入系统的音频来自多个不同的用户。我希望能够训练系统更准确地识别每个不同用户的语音。

我在 Windows(本例中为 Windows 7)中找到了语音识别控制面板,我可以在其中配置训练配置文件。为自己设置个人资料并进行培训过程显着提高了识别的准确性。所以我可以为每个用户设置配置文件并让他们进行培训过程,但是我需要能够在我的应用程序中选择正确的配置文件。

我的应用程序是一个“服务器”,它一次接收来自一个或多个用户的音频流并执行语音识别。因此,我需要能够以编程方式为我的应用程序创建的识别引擎的每个实例指定要使用的识别配置文件。这不是一个单用户应用程序,所以我不能让他们从 Windows 控制面板中选择他们的配置文件。

0 投票
4 回答
7073 浏览

iphone - 如何在 iPhone 中进行语音到文本的转换

有什么方法可以使用 iPhone SDK 将语音转换为文本?

0 投票
2 回答
1102 浏览

speech-recognition - Quickest and easiest way to implement speech to text conversion for a small speech subset

I want to implement a system that receives speech through a microphone on my Mac OS x. I know arbitrary speech recognition is close to impossible without training the system so I'm willing to restrict it to 10 simple sentences. It must recognize with a high degree of accuracy which of these 10 sentences are being spoken, generate the text and add an entry to a remote MySQL database.

With these being the architecture of the system I want to implement, could anyone give me an overview of what would be the best way to go about implementing this system? I'm looking for ideas like open source libraries to minimize the coding as this is just a prototype application for a demonstration. Basically I'm looking for a quick and easy solution. Thanks!

0 投票
2 回答
1584 浏览

speech-recognition - 服务器端语音转文本

我正在尝试安装语音识别引擎服务器端。(非商业首选,因为它只是为了实验)

这个想法是允许用户从网站上说些什么,然后他/她说的任何内容都会显示在屏幕上(作为文本)

我已经阅读了许多可用的软件,包括 Microsoft Speech、Sphinx、Julius 等,只是不确定哪一个的性能最好且最容易安装。通常我是否需要在我的主机上获得 root 权限才能执行此类操作?我现在正在使用常规的共享主机。

谢谢你,
三通

0 投票
1 回答
887 浏览

speech-recognition - 可以先做 SpeechToText(语音识别),然后再做 TextToSpeech(使用相同的文本和相同的声音)?

我正在为音盲人士开发一个程序。我一直在使用 sapi 和 TTs。该程序同时用一只手制作 3D 动画。但问题是声音(即使是最慢的声音)对于我想要的东西来说太快了。所以,我考虑过语音识别,但问题是我必须在动画开始之前对文本做一个大的处理。

所以,我想知道是否可以进行语音识别(从我在 .wave 文件上的声音),然后执行相同的 TT 过程(使用 Sapi 事件......),但在我的声音中使用 .wave。

如果可能,请告诉我如何。如果你认为有更好的选择,让我看看。

谢谢你的时间(请原谅我的英语)

耶稣凯维奇

0 投票
1 回答
751 浏览

speech-recognition - SAPI:服务器端听写

伙计们,我正在尝试组建一个服务器端系统,在该系统中我使用 Microsoft SAPI 来:

  • 在服务器中执行多个同时听写式识别。
  • 此外,所有识别都可能使用不同的扬声器配置文件(我的应用程序将识别用户并向 SAPI 指示要加载的配置文件)。
  • 我还想以编程方式训练各种用户资料。

我已经知道上述某些内容是不可能从托管代码中实现的,即 System.speech 命名空间。谁能告诉我我在理论上使用 SAPI 5.x 尝试做的事情是否可行?

谢谢你的帮助。

-拉吉