可以从这样的媒体中提取什么样的语义信息?任何事情都可以,无论是区分音乐和口语文本、检测不同的声音(如枪声、鸟类或汽车)、检测室内/室外拍摄或摄像机运动的强度。
我知道这个类别中有很多很多很多很多很多研究课题,但我没有找到任何应用。有人有关于这些主题的即将推出的产品的应用程序/库/工作原型/新闻的链接吗?
查看MP4REG,它是“MP4 Family”文件中代码点的注册机构。
简短入门:在 MPEG4 和 QuickTime 世界中,媒体的基本物理构建块称为“原子”。Atoms 不仅可以包含实际的音频和视频,还可以包含技术和非技术元数据。最后一个对你来说听起来很有趣。
例如:
albm
:专辑标题和曲目编号(用户数据)jp2i
: 知识产权信息关于元数据,我只仔细研究过一次这些东西,我的印象是它是一个快速而松散的世界。您可能想查看一些低级 MP4 解析工具,它们可以让您检查现实世界媒体文件的各个原子。我认为甚至有非官方的(未注册的)自定义原子可在特定系统中使用。
查找此应用程序的最佳主题是您可能希望查看“基于内容的视频检索和索引”的研究主题
除此之外:
一种应用是商业移除。广告去除器通常采用聚类方法来去除电视视频中的广告部分。
如今,音乐特征分析是一个巨大的话题。想象各种可能性! http://en.wikipedia.org/wiki/Music_information_retrieval
另外,查看 Conet 项目:http ://www.archive.org/details/ird059