问题标签 [speech-to-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1587 浏览

speech-to-text - 所有语音到文本的算法都是实时运行的吗?

当前技术的所有语音到文本算法都是实时运行的吗?我不是指一个人坐在电脑前拿着麦克风,而是输入一个预先录制的音频文件。

ie 如果你有一个 30 分钟的录音,是否总是需要 30 分钟才能被转录?

有不同的方法吗?

0 投票
2 回答
4032 浏览

asp.net - 微软语音 API 5.1、5.3?

我对可用的不同 SAPI 版本有点困惑。

首先,我只找到了5.1版本的SDK,有没有5.3版本的SDK,如果没有,为什么?

如果我正在使用 .Net 框架的 3.5 版本进行开发,我可以使用 Witch 版本。

有没有什么好的教程,因为我发现的唯一一个很旧(他们使用 2003 版的 Visual Studio):http: //msdn.microsoft.com/en-us/library/ms986944.aspx

有什么方法可以直接在 Asp.Net 网站中以语音到文本模式使用语音 API 吗?

谢谢!

0 投票
4 回答
202351 浏览

audio - 如何将语音转换为文本?

如何获取 MP3 并将语音转换为文本?

我有一些会议记录和会议记录(录音中只有一个声音,这是我的声音)。我认为使用语音转文本工具而不是简单地手动转录会更容易且在智力上很有趣。我知道有一些技术,特别是对于使用 Asterisk 和 Podcast 的 VoIP 应用程序,但它们是什么以及如何使用它们?

0 投票
4 回答
21900 浏览

iphone - iPhone App › 添加语音识别?

我想构建一个使用语音识别的应用程序。我见过像谷歌这样的大公司实现了这个功能,但我很好奇在初创阶段做这件事。有人调查过这个吗?我们有什么工具可以做到这一点吗?

0 投票
2 回答
4336 浏览

speech-to-text - 以自动方式转录 WMA/MP3 音频?

我有很多 WMA 格式的语音音频,我想用机器转录它——即使转录不是 100% 准确,我认为它可以作为一些音频的“索引”有很大帮助. 我愿意编写一些代码来实现这一点,但微软的语音 API 可以帮助我吗?是否已经有可以为我执行此操作的应用程序?

0 投票
3 回答
6771 浏览

speech-recognition - 让 WAV 文件转录与 Sphinx4 一起工作

我已经在我的 Windows XP 系统上安装了Sphinx-4并设置了 JSAPI。我想将英语口语 WAV(或 MP3)文件转录为文本。

当我运行“WavFile”演示时 - 它运行成功。

但是,当我像这样传递自己的 wav 文件时:

我得到:

正在加载“jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml”中定义的识别器...

解码 jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav 结果:一二三四五

似乎这个演示设置为加载和运行内部 wav 文件(“12345.wav”)或其他东西。

我已经阅读了文档,只是不知道如何设置“config.xml”,甚至不知道将其放置在哪个目录中。我只是想获得一个使用标准演示运行的简单概念证明。

所以,问题是:如何运行 Sphinx4 程序来转录 wav 文件?

谢谢。

0 投票
1 回答
3123 浏览

iphone - 通过 API 进行语音到文本对话

任何人都可以建议免费的 API(这非常好)或付费将语音转换为 iPhone 应用程序的文本。

谢谢,阿利安

0 投票
2 回答
683 浏览

speech-recognition - 有没有在语音级别输出语音到文本的软件?

是否有任何软件能够获取音频文件并输出语音 (IPA) 文本?

我知道那里的大部分软件都将其直接转换为一种语言,但是有没有一种“可教”的软件?

0 投票
5 回答
14313 浏览

c# - C#:使用 System.Speech 命名空间将 WAV 文件转录为文本(语音到文本)

如何使用 .NET 语音命名空间类将WAV文件中的音频转换为可以在屏幕上显示或保存到文件的文本形式?

我正在寻找一些教程示例。

更新

在这里找到了一个代码示例。但是当我尝试它时,它给出了不正确的结果。下面是我采用的 vb 代码示例。(实际上我不介意语言,只要它是 vb/c#...)。它没有给我正确的结果。我假设如果我们输入正确的语法——即我们在录音中期望的单词——我们应该得到它的文本输出。首先,我尝试使用通话中的示例词。它有时只打印那个(一个)单词而没有其他任何东西。然后我尝试了我们在录音中完全没想到的单词......不幸的是它也打印出来了...... :(

更新(11月28日之后)

找到了一种加载默认语法的方法。它是这样的:

这里仍然存在问题。识别不准确。输出是垃圾。对于一个 6 分钟的文件,它可能会提供 5-6 个与语音文件完全无关的文本单词。

0 投票
3 回答
3809 浏览

algorithm - 如何进行未经训练的语音到文本转换器?

我从很小的时候就患有严重的耳聋,但幸运的是我可以像正常人一样说话。由于我的语音识别能力受损,即使是唇读,语言交流对我来说一直很困难。我只是通过阅读板、powerpoint幻灯片、书籍和互联网完成了学校和大学的学习。我目前的软件工程工作做得很好,但最近我觉得我必须付出一些努力来改善我的情况。

字幕是我在这个国家理解电视电影/节目的救星,而我在过去的 7 年里一直在享受这一点(我现在 31 岁)。

每当我与某个人,甚至是陌生人交谈时,我都强烈地感到需要能够在现实生活中看到字幕。我想开发一个未经训练的语音到文本转换器,首先它甚至不需要为我拼出确切的单词,只有音节/语音方面的提示也可以。

我已经用谷歌搜索了一段时间,但大多数结果要么是文本到语音,要么是半生不熟的语音识别尝试,以向计算机发出语音命令。我真的很想得到一些关于如何开始这个项目的指示。具体来说,我需要一些步骤,例如如何处理音频文件以及我必须做什么样的处理才能尽可能快地获得近似语音。