我正在寻找一个开源库或框架来处理来自电视采集卡的音频信号。这个想法是检测电视广告点并记录它们发生的时间和频道。我从未从事过这样的工作,因此欢迎提供任何信息、链接和想法。
提前致谢!
编辑:我不在乎语言或操作系统。我想澄清一下,我的目标是检测我工作的公司的具体广告。所以,我认为我应该使用我们广告的指纹,并根据捕获的数据检查它们。如果您有这方面的信息,也欢迎。
我正在寻找一个开源库或框架来处理来自电视采集卡的音频信号。这个想法是检测电视广告点并记录它们发生的时间和频道。我从未从事过这样的工作,因此欢迎提供任何信息、链接和想法。
提前致谢!
编辑:我不在乎语言或操作系统。我想澄清一下,我的目标是检测我工作的公司的具体广告。所以,我认为我应该使用我们广告的指纹,并根据捕获的数据检查它们。如果您有这方面的信息,也欢迎。
最初可以使用虚拟配音之类的东西来捕获视频。
检测广告往往是几件事的结合:
广告长度往往是 5 秒的倍数,因此可以根据此验证可疑的起点和终点(但在不同国家/地区可能会有所不同)。
声音通常在过渡点完全下降。
空白帧或显着变化也同时发生。
根据电台的不同,您可能会在广告开始时检测到其他徽标和内容。
显然,并非所有这些事情都得到保证,您最终往往会根据所有这些因素做出判断,并在稍后进行某种目视检查。
编辑:
要查找特定广告,您需要在广告上存储一些相关信息(如您所说的指纹),例如:
广告长度。
声音级别,可能在几个时间点进行。
颜色信息,也许是 rgb 级别,因为它们在整个广告中有所不同。
作为这些东西的组合,您可以想出匹配的“候选人”,但绝不是 100% 准确。
@Jonathan Barbero:你可以试试 Gstreamer。
例如:gst-launch -v videotestsrc !ffmpeg色彩空间!ximagesink