0

不久前,我在一家德国公司的网站上看到了一系列有趣的视频演示。他们处理在播放时修改视频流,这种技术的准确性和流畅性给我留下了愉快的印象。在所有这些演示文稿中,我认为其中一个在动态播放视频中的文本混合方面非常吸引人。它允许您在播放视频时在文本框中键入字符串,并以逼真的准确性嵌入您在视频中编写的文本的转换变体。我的问题是,如果您碰巧知道此类功能需要哪种算法,我如何以编程方式将实时文本和图像嵌入视频流中?是否有任何研究论文或图书馆我应该查看详细信息?

PS。不要因为视频的内容而抨击我,这是我感兴趣的编程技术,视频是我能找到的最好的例子。

4

3 回答 3

2

它被称为增强现实,并且有许多库和工具包可用于这样做,例如artoolkit http://www.hitl.washington.edu/artoolkit/

于 2009-11-27T21:52:54.860 回答
0

为此,您只需要在渲染帧之前对其进行调解。

基本上:

  1. 读帧
  2. 修改框架
  3. 使成为

确实没有算法可以做到这一点。

于 2009-11-28T00:13:12.563 回答
0

好的,所以我实际上查看了您的示例。由于这是预先录制的视频,他们可能只是用手将盒子的四个角追踪到目标表面上。然后进行渲染,您只需将文本透视变换到目标矩形。让它融合可能只是选择好的颜色、分层、颜色转换和透明度的艺术。这里没有什么特别神奇的,只是标准的 Photoshop 风格的图形算法,其中大部分可能只是内置在 Flash 中。

于 2009-11-28T10:49:19.767 回答