30

我不确定 Youtube 是否是唯一拥有这项技术的网站,但 YT(Content ID)中的内容识别基本上是一种自动识别和删除侵犯版权的技术。你可以在这里读更多关于它的内容:

http://www.youtube.com/t/contentid

好吧,当我的一个视频(包含特定音乐曲目)因侵犯版权而被标记和删除时,我认为它 [内容 ID 系统] 可能很愚蠢。于是做了一些实验:都没有骗过滤镜~

  • 在歌曲中间添加了一系列哔声
  • 通过歌曲多次改变音高
  • 改变了几次音量
  • 调整了速度
  • 添加了音频覆盖
  • 添加了一些音频效果

另一方面,我不知道有任何材料被错误地匹配为受版权保护。例如,钢琴版本的歌曲不会错误地触发审查。

我不是在抱怨我的视频被删除。我只是对内容审查员的有效性感到惊讶。我想知道算法如何正确地将这首歌识别为侵犯版权,即使在我努力规避它之后也是如此。任何直接匹配的尝试都会立即被击败,任何涉及音符模式的算法都可能被哔哔声和音高变化所愚弄。

好吧,这更多是我的好奇心,而不是一个紧迫的问题..

4

1 回答 1

22

Pedro Moreno和 Google/Youtube 的其他人正在研究它。他们使用有限状态传感器来识别音乐音素单元的序列,类似于自动语音识别中的音素。

看看这篇文章:

如果你在整首歌曲中改变速度或音高,我很惊讶这些算法仍然可以识别歌曲。但也许他们将音高和速度(使用节拍之间的时间)标准化,以便能够识别覆盖的版本,而不仅仅是原始版本。但它可以忽略您添加的哔哔声也就不足为奇了,因为否则您的音频流中有足够的相似性。

(实际上,基于有限状态的算法非常适合应用于我的 iTunes 库,以正确标记文件。因为像MusicBrainz这样的服务或多或少依赖于音频和数据库条目的精确哈希匹配,而传感器方法似乎在识别文件时更具差异性。)

于 2009-03-16T03:35:51.160 回答