4

我正在寻找一种程序化视频编辑解决方案,它可以提供 API,用于在视频 (1080p) 剪辑的特定坐标处的特定时间/帧中添加图像和文本叠加,以及调整到 720p 等。

我尝试了 AviSynth,但由于“内存不足错误”,总共叠加了约 400 次后被阻止 - 请参阅AviSynth 内存不足错误(100 次图像叠加)

还有什么我可以尝试的(示例代码会很棒)?

4

1 回答 1

6

您始终可以使用我推荐的商业解决方案,例如 Adob​​e After Effects,它有一个您可以使用 JavaScript(jsx文件)控制的 API。

与免费/开源替代方案相比,商业视频和合成解决方案通常更强大,并且具有更好的缓存和缓冲能力,这意味着它们可以潜在地为合成添加更多层而不会耗尽内存。

(顺便说一句:我在此处向您指出 After Effects 事件,尽管它是面向合成的。Adobe Premier(或其他非线性编辑器)对于简单的图像和文本叠加来说是一个更自然的选择,但它没有脚本界面(AFAIK 和 Adob​​e 网站上没有为此列出的资源)。但是,也可以使用 AE 创建长序列,您可以使用添加到场景中的元素做更多事情。)

如果您已经熟悉 JavaScript,那么(显然)只需阅读其对象、方法和属性等的 API 文档即可(我在下面添加了指向文档的链接)。

Adobe 也有自己的 JavaScript 编辑器(但不是必需的),可以在以下位置找到:

Mac OS X:

/Applications/Utilities/Adobe Utilities CS6/ExtendScript Toolkit CS6/

视窗:

C:\Program Files\Adobe\Adobe Utilities - CS6\ExtendScript Toolkit CS6

以下来自该站点的示例创建了一个合成,然后向其添加了一个文本层(请访问该站点以获取完整脚本):

// create project if necessary

var proj = app.project;
if(!proj) proj = app.newProject();

// create new comp named 'my text comp'

var compW = 160; // comp width
var compH = 120; // comp height
var compL = 15;  // comp length (seconds)
var compRate = 24; // comp frame rate
var compBG = [48/255,63/255,84/255] // comp background color

var myItemCollection = app.project.items;
var myComp = myItemCollection.addComp('my text',compW,compH,1,compL,compRate);

myComp.bgColor = compBG;

然后添加一个文本层:

var text;
while (!myFile.eof){
    text = myFile.readln();
    if (text == "") text = "\r" ;
    myComp.layers.addText(text);
}

您还可以使用 JavaScript/jsx 文件控制 Photoshop/Illustrator,这样您就可以制作强大的组合/效果等(这让我想起了古老的 AREXX :-))。

有类似的 API 用于解决方案,例如使用 Python 的 Flame(以及 Auto-desk 购买后不再可用的 Combustion),但这里的价格范围相对较高。

如果商业变体不是一个选项,那么您可以查看 Blender,它也为 Python 提供 API。

但请注意,Blender 主要面向 3D,但也可用于视频合成。

取自此页面的示例将文本写入屏幕:

def write():
    """write on screen"""
    width = render.getWindowWidth()
    height = render.getWindowHeight()

    # OpenGL setup
    bgl.glMatrixMode(bgl.GL_PROJECTION)
    bgl.glLoadIdentity()
    bgl.gluOrtho2D(0, width, 0, height)
    bgl.glMatrixMode(bgl.GL_MODELVIEW)
    bgl.glLoadIdentity()

    # BLF drawing routine
    font_id = logic.font_id
    blf.position(font_id, (width * 0.2), (height * 0.3), 0)
    blf.size(font_id, 50, 72)
    blf.draw(font_id, "Hello World")

当然,您总是可以编写程序,例如 FFmpeg,它本身就非常强大和灵活。

您可以通过在命令行中添加参数来编写脚本,例如(取自此处):

在视频帧的最后一行显示从右向左滑动的文本行。假定文件“LONG_LINE”包含没有换行符的单行。

drawtext="fontsize=15:fontfile=FreeSerif.ttf:text=LONG_LINE:y=h-line_h:x=-50*t"

您只需将其放入某种批处理文件中并运行它。当然,限制是您需要进行一些反复试验才能使文本和图像准确显示在您想要的位置。

我从未尝试过数百层,我怀疑它是否具有内置缓冲区/缓存来处理大量层,但值得一试,因为它既免费又强大。

资源:

于 2013-09-19T06:08:07.363 回答