与键盘或小键盘相比,它背后的基本原理(在可用性方面)是什么?
可用性是一个非常广泛的术语。如果我试图用触摸板输入我的地址,它就不会被认为很有用。有人认为,使用整体成功率为 70-80% 的语音引擎也不是很有用。正如其他帖子中所指出的,对于那些使用手机的人来说,免提输入会容易得多。但是,如果主题对呼叫者来说有些陌生,那么使用文字输入与数字输入实际上可能不如按键式电话那么直观。呼叫者听到不太熟悉的术语和短语在提示的 10-30 秒内无法记住它们,但他们可以用手指将鼠标悬停在听起来最好的选择上或记住选择的顺序。
你有什么理由投资这个开发项目?
这是一个奇怪的问题。通常,在 IVR 环境中是否使用语音的决定并非来自世界的发展观。除非您有真正需要语音的特定要求,否则您几乎总是会降低总体成功率。演讲通常是企业形象的一个因素……或者拥有最新的技术玩具。
我想当你在车里而不拿着手机时这是一个加分,但值得额外的等待时间吗?
如今,使用现代 ASR 时,语音识别延迟并不是很高。在大多数情况下,输入与语音并行处理,语音识别结束之间的时间为 0.5 到 1 秒。请注意,许多 IVR 需要在某些输入后执行数据查找,这可能会显示为较慢的系统。超过 1 秒的正常输入通常是部署功率不足的迹象。
它在最初实施时可能并没有动力不足,但是通过调整工作,您可以做出很多性能与准确性的决定。为了获得下一个 0.1%,可以将资源推到超出峰值时的水平。
此外,可靠性肯定比以前更好,但有时感觉更像是某人决定插入系统的玩具,因此它可以让人感觉未来感。
一般来说,是的。在可靠性方面,您需要真正查看总体数字以了解系统。这是一场统计数据之战,个人不是很重要(除非他们拥有 VP 或以上的头衔)。通过优化输入(移动提示)、资源使用和其他语音识别调整参数,您可以尝试最大限度地提高准确性。对于基本的自然语言响应,您可以达到 90 多岁。但是,您的总体成功率要低得多。想象一下 5 个提示全部为 98%(实际上,您往往有一堆 99,然后是几个 90 年代中期或略低于):.98 * .98 * .98 * .98 * .98 = 90%。这意味着十分之一的失败。那是在呼叫者混淆和业务规则之前。DTMF 输入通常非常接近 100%,即使在多次输入后也是如此。
有设计 IVR 或使用(或选择不使用)语音识别的软件的经验吗?是的。但是,我怀疑这真的不是你想要的问题。作为技术方面的人,这通常不是你的决定,你对它的影响有限。如果您真的在寻找演讲的利弊:
优点:
- 酷/时髦(注意,仅语音是不够的。您需要出色的 VUI 和语音才能)
- 适合避开耳塞的高度流动的人群。未来应该是将语音与触觉输入相结合。也许。它可能不会来自市场的 IVR 方面。
- 适用于 DTMF 无法完成的任务。请注意,其中许多问题在语音方面的成功率也很低。成本(相对于人力)通常是驱动因素而不是可用性。将呼叫放入语音信箱以更改地址可能非常划算。
缺点:
- 开发、部署和维护成本高昂。如果您不小心,添加新选择可能会对成功率产生重大影响。始终监控变化的影响。
- 经常部署不当。例如,只需说出您的数字菜单选择。这几乎常常是我们想要言语冷静,但却买不起真正需要什么才能实现言语冷静的情况。
- 成功率会更低,因此呼叫中心的成本会更高。
- 失败往往集中在特定的提示和个别呼叫者上。经常遇到系统问题的呼叫者会对您非常不满。
- 当他们不被理解时,呼叫者会生气。您的目标是确定您的客户群的一个子集并真正激怒他们吗?