问题标签 [nuance]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
386 浏览

java - 销毁 Nuance 会话

我有一个创建“音频”类的活动,并尝试使用 android Text to Speech API 来读取一些文本。如果该语言不受支持,它会尝试使用 MediaPlayer 从服务器播放自定义 mp3 文件。最后,如果 MediaPlayer 失败,它会使用 Nuance SpeechKit 来读取文本:

通量图

我的问题是当我销毁活动时,我也想销毁/停止 Nuance 音频,但我不确定如何关闭 Nuance 音频。

活动课

音频类

如果我使用 Text to Speech 或 MediaPlayer 并且我销毁了我的 Activity,则音频会立即被销毁。但如果正在播放 Nuance,我似乎无法破坏音频。它只是一直在说话。

我做了一些调试,并调用了 pause() 和 destroy() 方法。nuance.getAudioPlayer 也不为空,并且正在播放 AudioPlayer。当我对他调用方法 stop() 时,我找不到他没有停止的原因。


什么是细微差别?

这是我第一次使用 Nuance,所以我对此并不熟悉。基本上我认为它是 Android Text to Speech 的替代品。

细微差别开发人员

为什么我的项目中有这个?

我的项目有 4 种主要语言,我需要一个文本到语音功能来阅读一些文本。问题是,android Text to Speech 不支持 Nuance 支持的其中一些语言。

为什么 Nuance 是我的最后选择?

因为 Nuance 有成本。我尝试使用 android TTS 或 MediaPlayer。只有当这两个失败时,我才会使用 Nuance。这是阅读我的文字的最后手段!

0 投票
1 回答
140 浏览

nuance - 细微差别:语音识别,回答用户查询的算法

对于语音激活的应用程序(虚拟助手),例如(aivc for android),它使用细微差别的语音识别,使用哪个 API 来获取用户问题的答案。例如,如果用户键入“你的名字是什么”,则 ap 会给出答案。我们是否有一个标准算法可以理解用户的查询并获得可能的答案。

0 投票
0 回答
110 浏览

objective-c - 如何从 Nuance 打印错误消息

我正在使用 Nuance Speechkit 开发语音应用程序。我想从 nuance 打印错误消息。我不知道如何获取错误消息。

这是委托方法

这是我在控制台中遇到的错误。

NMT CloudRecognizer 错误 [Session ID:d40874d7-e31c-43bd-b268-0792c1b26def] [Type:2] [Code:5] [Message:(null)] [ErrorParam:AUDIO_INFO] [Prompt:对不起,语音无法识别。请重试。] 2017-07-07 12:19:46.297803 Link[3223:2004075] CloudRecognizer 错误 [会话 ID:d40874d7-e31c-43bd-b268-0792c1b26def] [类型:2] [代码:5] [消息: (null)] [ErrorParam:AUDIO_INFO] [Prompt:对不起,语音无法识别。请再试一次。

我想得到提示,需要显示一个弹出窗口。我该怎么做。请帮助我。

0 投票
1 回答
63 浏览

node.js - 如何用一个脚本处理多个文件?

您好,我正在使用 Nuance 进行一些关于语音到文本的实验,我正在使用节点创建请求,如下所示:

我的凭据:

然后我发送请求如下:

这种方式的问题是我需要使用几个调用来改变这部分:

由于我在终端中执行请求如下:

然后我在终端上得到结果。

我试过了:

只处理 2 次对话我正在重复代码,因为我不相信这是最佳方式。为了处理我的所有文件:

我想知道如何创建一个 for 以便在一个脚本中处理更多文件,所以我真的很想感谢支持以克服这项任务。

0 投票
2 回答
371 浏览

audio - 使用 okhttp 上传 .pcm 文件

我正在尝试使用 Nuance 将语音转换为文本,因此我正在尝试发送此请求

需要上传音频文件(.pcm)格式。

我正在使用 okhttp3 库以下是构建器

我收到以下日志

HTTP 错误 500

访问 /NMDPAsrCmdServlet/dictation 时出现问题。原因:

p>

缺少什么?

0 投票
2 回答
429 浏览

c# - 在参考 wcf 服务中部署 nuance ocr sdk

我已经在 Web API 中编写了用于细微差别 OCR 集成 getImageText(String FileName) 的集成代码。代码可以完美地编译和执行,并给出正确的输出。

但是当我将相同的代码移动到 Web 服务并从 Web API 控制器调用它时,我在执行时遇到了以下异常。

“无法加载文件或程序集 'Nuance.OmniPage.CSDK.Objects, Version=20.0.0.0, Culture=neutral, PublicKeyToken=d277acbc760e5eaf' 或其依赖项之一。尝试加载格式不正确的程序。”

目标 CPU 平台设置为任何 CPU。Visual Studio 目标 CPU 平台 32 位。Window 10、64 位操作系统。

我尝试使用每组细微差别 SDK 二进制文件(即 x64 和 x86)执行该方法,但问题没有解决。

0 投票
0 回答
284 浏览

c# - 将 Nuance Dragon 集成到 .net Web 应用程序中

我希望将语音到文本功能集成到 WEB 应用程序中,用户可以在其中口述而不是输入医疗记录,应用程序将捕获并保存它。想检查 nuance dragon 是否可以集成到我的应用程序中以捕获和翻译语音并返回相应的语音文本,然后我可以将其存储在我的数据库中?

如果有任何其他替代细微差别的龙,也很高兴知道这些。

谢谢!

0 投票
1 回答
214 浏览

robot - Pepper Robot 中使用免费细微差别 API 说话的限制?

在 Pepper Robot 中使用免费的细微差别 API 版本每月/每周说的话是否有任何限制?

0 投票
0 回答
111 浏览

android - 由于 Nuance Dragon Medical SpeechKit 而导致的 ANR

我们正在为我们的安卓应用程序使用 Nuance Dragon Medical SpeechKit。现在问题是您必须启用要设置语音识别的 EditText 或以其他方式禁用。使用后我们必须禁用它,因为我们不希望它的语音栏占据我们的屏幕。问题是当我们重复这样做 4、5 次时。我们的应用程序进入 ANR。我还没有找到任何解决方案。

0 投票
1 回答
466 浏览

speech-recognition - 有没有办法在 grxml 中进行条件逻辑?

我正在为语音识别开发语法并且遇到了障碍。

如果客户不知道提示的答案并说“不知道”而其他客户确实知道答案,我正在考虑将它们分开。

例如,如果请求一个保险号码:AB112233C,而用户要么知道,要么不知道。

如果用户不知道,我想在应用程序中执行特定操作。

我使用 NUANCE 作为 ASR。