我正在从事一个涉及从视频中检索对象的广泛项目。
根据“基于视觉内容的视频索引和检索的调查”,最流行的方法分为:
- 简单的“基于阈值的方法”(全局或自适应)
- 基于监督学习的分类器(使用 SVM 或 AdaBoost)
- 基于无监督学习的算法(主要是 K-Means)
目前,我自己实现了一种非常简单且老式的方法,该方法基于连续帧之间颜色直方图的差异。
尽管如此,考虑到镜头边界检测不是我研究的主要主题,我想尝试一些更有效和最新的东西,而不会花费太多时间。
有人知道有效算法的实现吗?
我正在从事一个涉及从视频中检索对象的广泛项目。
根据“基于视觉内容的视频索引和检索的调查”,最流行的方法分为:
目前,我自己实现了一种非常简单且老式的方法,该方法基于连续帧之间颜色直方图的差异。
尽管如此,考虑到镜头边界检测不是我研究的主要主题,我想尝试一些更有效和最新的东西,而不会花费太多时间。
有人知道有效算法的实现吗?
我发现以下实现在我自己的研究中非常有用和有效:
https://github.com/johmathe/Shotdetect
代码库的主力发生在这里:
https://github.com/johmathe/Shotdetect/blob/master/src/film.cc#L117-237
它主要依靠颜色信息来检测镜头。
计算相邻帧RGB直方图的卡方距离是一种快速、简单、鲁棒的镜头边界检测方法。你可以在这里看到我对这个方法的实现和使用。