0

我发现动态时间扭曲 (dtw) 可用于在 2 个演讲之间找到相似之处,但我发现的所有示例仅输出 2 个演讲之间的矩阵。

我想知道我是否可以输出对齐的语音?
例如,使用 10 秒语音作为基础并与 7 秒语音进行比较,我想让 7 秒语音与 10 秒语音对齐。

4

0 回答 0