不久前,我在一家德国公司的网站上看到了一系列有趣的视频演示。他们处理在播放时修改视频流,这种技术的准确性和流畅性给我留下了愉快的印象。在所有这些演示文稿中,我认为其中一个在动态播放视频中的文本混合方面非常吸引人。它允许您在播放视频时在文本框中键入字符串,并以逼真的准确性嵌入您在视频中编写的文本的转换变体。我的问题是,如果您碰巧知道此类功能需要哪种算法,我如何以编程方式将实时文本和图像嵌入视频流中?是否有任何研究论文或图书馆我应该查看详细信息?
PS。不要因为视频的内容而抨击我,这是我感兴趣的编程技术,视频是我能找到的最好的例子。