7

我正在寻找如何将 CMU Sphinx 与 Ruby (Rails) 应用程序一起使用。我需要非常简单的任务 - 我有一个 mp3 文件,我想把它转录成文本。

我怎样才能实现这个最简单的方法?我不知道 C/C++,而且我的任务并不是为它学习 C/C++ :)

感谢帮助!

4

3 回答 3

10

CMUSphinx 提供了几个接口,您可以使用它们来利用语音识别功能。其中一些可能更适合您,一些则更少:

  1. 使用命令行工具并将它们作为 Rails 应用程序的外部二进制文件执行以获得所需的结果。要执行的工具是pocketsphinx_continuous。有关如何从 Rails 调用二进制文件的更多信息,请参阅问题: 如何在 heroku 上执行二进制文件?

  2. 您可以使用 JVM 从 JRuby 调用 Sphinx4 框架,例如如何从JRuby使用 Sphinx4 :http ://cmusphinx.sourceforge.net/wiki/tutorialsphinx4#writing_scripts

  3. 您可以使用SWIG实现 pocketsphinx 绑定。简单的部分是 Python 的 swig 包装器已经作为 pocketsphinx 的一部分存在,你只需要使用 SWIG 来生成 Ruby 包装器:https ://sourceforge.net/p/cmusphinx/code/11643/tree/trunk/口袋狮身人面像/痛饮/

  4. 最后,您可以使用 Java REST 框架实现 REST Web,以使用 CMUSphinx 工具将音频转换为文本,并从您的 Ruby 代码中调用服务。有关更多信息,请参阅如何使用Rails 中的 REST 这种方式可以使您的系统真正具有可扩展性。

于 2012-11-09T12:23:07.057 回答
3

我最近为此创建了一个 gem:

https://github.com/watsonbox/pocketsphinx-ruby

它使用 Ruby 外部函数接口 (FFI) 直接与 libpocketsphinx 交互。

于 2014-10-21T17:49:48.010 回答
1

也许看看这个使用 PocketSphinx 的基于 Ruby 的语音识别网络服务:

https://github.com/alumae/ruby-pocketsphinx-server

于 2012-11-12T22:40:11.410 回答