algorithm - Youtube内容识别技术？

Question

我不确定 Youtube 是否是唯一拥有这项技术的网站，但 YT（Content ID）中的内容识别基本上是一种自动识别和删除侵犯版权的技术。你可以在这里读更多关于它的内容：

好吧，当我的一个视频（包含特定音乐曲目）因侵犯版权而被标记和删除时，我认为它 [内容 ID 系统] 可能很愚蠢。于是做了一些实验：都没有骗过滤镜~

另一方面，我不知道有任何材料被错误地匹配为受版权保护。例如，钢琴版本的歌曲不会错误地触发审查。

我不是在抱怨我的视频被删除。我只是对内容审查员的有效性感到惊讶。我想知道算法如何正确地将这首歌识别为侵犯版权，即使在我努力规避它之后也是如此。任何直接匹配的尝试都会立即被击败，任何涉及音符模式的算法都可能被哔哔声和音高变化所愚弄。

好吧，这更多是我的好奇心，而不是一个紧迫的问题..

score 22 · Accepted Answer

Pedro Moreno和 Google/Youtube 的其他人正在研究它。他们使用有限状态传感器来识别音乐音素单元的序列，类似于自动语音识别中的音素。

看看这篇文章：

如果你在整首歌曲中改变速度或音高，我很惊讶这些算法仍然可以识别歌曲。但也许他们将音高和速度（使用节拍之间的时间）标准化，以便能够识别覆盖的版本，而不仅仅是原始版本。但它可以忽略您添加的哔哔声也就不足为奇了，因为否则您的音频流中有足够的相似性。

（实际上，基于有限状态的算法非常适合应用于我的 iTunes 库，以正确标记文件。因为像MusicBrainz这样的服务或多或少依赖于音频和数据库条目的精确哈希匹配，而传感器方法似乎在识别文件时更具差异性。）

1 回答 1