0

我正在尝试创建一个 Android 应用程序,它将从它的 ID3V2 标签中获取 mp3 的歌词。我的问题是,是否可以在歌曲播放时自动突出显示歌词?就像使用语音处理或类似的东西。我已经查看了以前的类似问题,但所有这些问题都需要手动输入。需要尽快反馈。谢谢你。

4

2 回答 2

7

这种事情在好莱坞电影场景中是可能的,使用类似于使用 4 像素正方形作为输入重建面部的图像增强技术。

好的,所以您的请求在理论上更可行,但我所知道的当前电话技术无法即时执行此操作。您可能需要一个Delorean 磁通电容器和一些钚

此外,检测音乐中的人声比对着手机发短信要困难得多:

  1. 歌词通常不遵循自然的语音节奏;
  2. 音乐的频谱往往与语音的频谱发生冲突;
  3. 声音的音高变化,使得分离和检测语音特征变得更加困难;
  4. 人声通常以与所有其他乐器相同的水平混合;
  5. IwannahuhIwannahuhIwannahuhIwannahuhIwannaReallireallirealliwannaZigaZiggUHH。
于 2012-08-13T02:29:05.287 回答
3

您可以查看这篇论文LyricSynchronizer:音乐音频信号和歌词之间的自动同步系统,以获得可能的解决方案。没有在 Java 中为 Android 实现任何东西,但是使用 NDK,您可以使用任何 C 代码并对其进行处理。;-)

本文描述了一种可以自动将复调音乐音频信号与其相应歌词同步的系统。尽管已经提出了通过使用维特比对齐技术来同步单声道语音信号和相应文本转录的方法,但是这些方法不能应用于CD录音中的人声,因为人声经常被伴奏声重叠。除了减少伴奏声音影响的传统方法外,我们因此开发了四种方法来克服这个问题:检测人声部分的方法、构建稳健音素网络的方法、检测摩擦音的方法和方法用于使语音识别器电话模型适应分离的声音信号。

祝您实施顺利!

于 2015-07-17T23:05:44.483 回答