我有一个大学项目,我正在开发一个充当翻译器的 Android 应用程序。对于普通文本翻译,我使用的是 Google Cloud Translation API,我看到他们可以选择使用 Google Cloud Speech API 通过语音翻译文本。问题是我没有起点,也不明白如何使用它。
那么,是否有一个示例说明如何从我的 Android 应用程序中使用 Google Cloud Speech API?
我有一个大学项目,我正在开发一个充当翻译器的 Android 应用程序。对于普通文本翻译,我使用的是 Google Cloud Translation API,我看到他们可以选择使用 Google Cloud Speech API 通过语音翻译文本。问题是我没有起点,也不明白如何使用它。
那么,是否有一个示例说明如何从我的 Android 应用程序中使用 Google Cloud Speech API?
Android 可以很好地运行 Java 示例。你可以在github上找到它们。
您也可以使用Android Speech API,它是免费的,不像 Google Cloud Speech API。
是的,这是可能的,我已经做到了,基于“android-docs-samples-master”中的谷歌“语音”示例(谷歌并下载这些示例)。你需要知道的事情:
更新:如果你得到这个工作,你可能已经注意到你第三次或第四次做 ASR 时,它失败了。这是因为示例代码并非旨在正确关闭和打开整个 ASR 识别器。我得到了它的工作,如果您需要有关特定错误的帮助,请告诉我。这是一个总结指南,如果您需要有关特定步骤的更多详细信息,请告诉我。
不过,Android Speech API 和 Google Cloud Speech API 之间存在一些关键差异。虽然 Android Speech API 是免费的,但它仅限于短语并且无法处理来自文件的音频。每个语音识别也以独特的哔哔声开始和结束,以便用户知道麦克风处于收听模式 - 这是一种谷歌防止编写欺骗应用程序的方式,当语音识别器在后台运行并将转录发送到后端服务器。Google Cloud Speech 解除了这些限制,但几乎不存在与 Android 的集成。虽然有一个 Android 演示项目,但要使其适应您的项目并不容易,而且会面临多种挑战和错误解决方案。这是谷歌在他们的网站上所说的:
注意:Cloud Java 客户端库目前不支持 Android。