algorithm - 通过语音查询进行语音检索

Question

我的主要问题如下：给定一组参考语音文件（从语音短语中提取的特征列表）和一个查询语音输入，我需要从我的参考文献中找出最适合数学的那个。关键是不要搜索所有这些，而是尽可能地修剪掉。有人可以向我指出解决此问题的有效算法或处理此类问题的任何开源代码吗？谢谢

score 1 · Accepted Answer

一种常用且有效的方法是将参考语音文件的索引构建为有限状态传感器。请参阅 Cyril Allauzen、Mehryar Mohri 和 Murat Saraclar 的论文“加权自动机的一般索引：应用于口语检索”（HLT-NAACL 2004） http://acl-arc.comp.nus.edu.sg/archives/ acl-arc-090501d4/data/pdf/anthology-PDF/W/W04/W04-2907.pdf

score 0 · Accepted Answer

我假设参考文件中的文本与查询文件中的文本相同。执行此操作的常用方法是简单地将每个参考文件与查询文件进行比较。通常你会使用动态时间扭曲算法——维基百科文章有几个实现的链接，你自己实现并不难。基本思想是尝试对齐这两个文件，然后选择最符合查询的参考。

我知道你说过你不想比较每个例子。在这种情况下，我的第一个想法是对参考文件进行聚类。离线时，您可以将参考文件相互比较，并将相似的文件组合在一起。当需要查询时，您只需比较每个集群中的一个示例。然后，您可以根据结果与最近的一个或多个集群中的所有文件进行比较。

这只是一个想法，我相信还有其他想法。

2 回答 2