31

在编程方面,有没有人使用 Dragon Naturally speak 语音识别软件取得成功?

我想知道,因为我认为这比我用手打字要快得多,而且在我的 carpol 隧道上更容易。

我每天都在 Visual Basic 6 IDE、Visual Studio 2008 IDE + Team Explorer 中编程,写电子邮件,并通过 Windows Live IM 聊天。

我需要一个基于命令的界面,我可以在其中将语音命令绑定到击键、在拼写/说单词/说没有空格的单词之间切换等。

任何意见都非常感谢。

4

8 回答 8

21

我认为“语音编程”和“语音编程”搜索“语音识别编程”更好。它已经尝试过,但还没有流行起来。

我读过的第一手资料似乎都同意语音编程对声带的伤害很大。然后他们继续说它是如何变得更好的,一个真正可用的系统可能指日可待。我第一次读到那是在 1990 年代后期...

于 2009-09-11T14:28:17.250 回答
5

我尝试使用通用语音识别进行编程,得出的结论是编程与常规口语相去甚远。您需要一种针对编码量身定制的特定语法(不一定是特定于语言的)。由于这次经历,我研究了使用语音识别进行编程。它仍然只是一个概念证明,但在某种程度上我相信它是可行的。

需要考虑的事项:

  • 如果您身体健康并且可以用双手全速编码,那么使用键盘/鼠标会更快。我以大约 60 wpm 的速度打字,我无法用语音更快地打字。但是,我是一个非常慢的打字机,只有一只手。我相信你可以通过语音命令的帮助来大大减少手臂的压力,而不是仅仅通过语音。
  • 编程 IDE 中有一些不是编码/打字的活动。能够使用语音执行其中许多任务应该会进一步减轻压力。
  • 并非每个人都在可以坐下来与计算机交谈的环境中工作。

POC 的短视频在 Youtube 上。http://www.youtube.com/watch?v=x3Lm9nrFeMk

于 2009-11-26T10:19:48.263 回答
4

听写通常通过具有语言模型(音素到字符串之间的映射)来工作。不幸的是,编程的语言模型根本与英语不太匹配,因此您的识别错误率会很高。

间距和导航是您最不必担心的;您可以构建一组宏来利用 Visual Studio 对您的代码的了解(goto 方法等)

IM 和电子邮件将由 DNS(或 Windows 语音识别,就此而言)很好地处理。

于 2009-11-05T17:56:14.143 回答
3

几年前我开发了 RSI(腱鞘炎),类似于双手腕的腕管,所以我当然可以理解想要切换到语音进行编码的需要。

不幸的是,实际上并没有很多东西可以以体面的方式完成工作 - 正如已经提到的那样,代码导航仅靠语音就非常令人沮丧,而且我们程序员需要的大量不寻常的字符只是无济于事一般使用!

我个人使用 Dragon Naturally speak 大约 3 个月,但最终认为它根本无法作为长期解决方案。物理治疗师向我建议尝试使用符合人体工程学的键盘Maltron(具有 Maltron 布局)。考虑到我在使用标准键盘时会感到疼痛,我现在可以整天无痛地编码。他们做(或习惯于)租赁模式,以便您尝试一下。即使您现在无法使用键盘,将来也可能值得考虑。

于 2009-09-11T14:56:17.257 回答
3

我认为语音识别可以帮助减少编程所需的击键次数。我正在使用 Dragon NaturallySpeaking 编写 PHP 代码,并创建了许多命令来输出常用语句。正如其他人所提到的,在代码中导航是一个困难。我会建议任何有重复性劳损的人尽量以尽可能多的方式减少他们的编程。例如,在您坐在显示器前仔细考虑您想要做什么。使用钢笔和铅笔编写伪代码。使您的代码尽可能可重用。坚持最佳编程实践。远离你的屏幕;看书。改变你的工作职位;我拿着 iPad 躺在地板上。尝试使用安卓语音识别来回复简短的电子邮件或短信;它是免费的和多语言的,在安静的环境中非常准确。站起来四处走走。考虑让其他人为您编写程序。

于 2013-03-05T02:10:14.863 回答
2

我的两个手腕都得了腱鞘炎,我用dragon 大约两年来做基本的打字。我有基本的编程能力,但我发现使用 Dragon 进行编码非常麻烦,这导致我选择了不同的职业道路。我使用 Microsoft 符合人体工程学的键盘和进化的鼠标,这有助于但不允许数小时无休止的打字和鼠标操作。

我认为可以编写一个用于dragon 的命令库(针对每种语言),但它不能成为键盘的真正替代品。

于 2011-08-22T03:23:04.767 回答
1

我不确定语音识别是否能够真正解决您的问题 - 是不是有太多在自然语言中很少使用但在编程中很常见的符号(大括号、分号、引号)?

但可能最妨碍体验的是——与普通文本不同——代码很少以线性方式编写,而是涉及在行、方法和类之间跳转(至少这是我经常做的)。当然,人们也可能会为此找到额外的语音命令,但我想整体体验不会太令人满意。

于 2009-09-11T05:28:07.720 回答
1

请通过以下链接了解有关 PSPD 的更多详细信息。 http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=5072009

本文提出了一种提取相空间点分布参数的方法,以提高语音识别系统的准确性。利用非线性或混沌信号处理技术提取基于时域的相空间特征,提出了一种语音识别方法

于 2011-11-24T02:30:55.563 回答