8

项目:在视频的每一帧上添加运行日期/时间戳。(数码摄像机的结果,我父亲问我如何将时间戳(以毫秒分辨率)永久添加到视频中。

一位朋友向我指出了 opencv(实际上是 emgucv),并且由于我的喜好,我在 python 中尝试了使用 opencv 的运气。

文档很蹩脚,我什至很难(花了我 5 个小时左右)来安装软件包。资料来源:

我在 Windows 7 x64 上工作,所以我不得不降级我的 python 以使用 numpy(没有用于 win64 的 numpy 版本)

使用 PyCharm IDE。

结果安装让我拥有文件 C:\Python27\Lib\site-packages\cv2.pyd

我正在尝试查找要开始使用的文档,但是我很困惑,不知道从哪里开始,所有示例都令人困惑-即:

我的问题:

  1. 难道我做错了什么?这不是安装opencv的方法吗?
  2. 我在哪里可以找到好的文档?
  3. 假设我准备好我的文本(在一个字符串中)有人可以尝试帮助我开始我的应用程序吗?

谢谢

4

2 回答 2

18

使用 OpenCV 和 Python,您的任务应该相对容易完成。看来你是 OpenCV 的新手,所以我会尽量让我的解释彻底,但如果你需要任何澄清,请随时询问。

我不确定您是从实时摄像机视频源中获取数据,还是对录制的镜头进行后处理。无论哪种方式...

获取数据。如果使用实时提要:

capture = cv2.VideoCapture(0)

如果使用录制的素材:

capture = cv2.VideoCapture("your_reading_file.avi")

初始化视频编写器。查看此问题以获取有关编解码器的帮助-找到工作的编解码器并非易事。我也在使用 Windows 7 x64,下面提到的编解码器是唯一对我有用的编解码器。此外,将变量设置为fps尽可能接近实际传入的视频帧速率 - 一旦开始写入帧,您就无法更改它。

flag, frame = capture.read() # **EDIT:** to get frame size
width = np.size(frame, 1) #here is why you need numpy!  (remember to "import numpy as np")
height = np.size(frame, 0)
writer = cv2.VideoWriter(filename="your_writing_file.avi", 
fourcc=cv2.cv.CV_FOURCC('I', 'Y', 'U', 'V'), #this is the codec that works for me
fps=15, #frames per second, I suggest 15 as a rough initial estimate
frameSize=(width, height))

处理这些数据并添加您的文本。最后,将编辑后的帧写入视频文件。

while True:
    flag, frame = capture.read() #Flag returns 1 for success, 0 for failure. Frame is the currently processed frame

    if flag == 0: #Something is wrong with your data, or the end of the video file was reached
        break 
    x = width/2
    y = height/2 #change to the desired coordinates
    text_color = (255,0,0) #color as (B,G,R)
    cv2.putText(frame, "your_string", (x,y), cv2.FONT_HERSHEY_PLAIN, 1.0, text_color, thickness=1, lineType=cv2.CV_AA)

    writer.write(frame) #write to the video file

就如此容易!我几乎每天都使用上面的代码将文本写入视频文件,所以它确实有效。我可以预见的唯一潜在问题是编解码器,不幸的是我对此知之甚少。我希望这可以解决您的问题,请随时提出更多问题。

编辑:回答您的评论问题。

1.) 据我所知,您只能使用 .avi,因为您必须在 OpenCV 中使用未压缩的格式。恐怕我不知道使用其他(压缩)格式。也许您可以使用第三方程序进行转换前/转换后?异常的原因frame是我的错误,我已经编辑了答案以包含缺失的行。

2.) 恐怕我不知道如何读取元数据。如果我发现了,我会告诉你的。我自己寻找视频帧率的 hackish 解决方案是让 OpenCV 运行一次视频,使用该Time模块计算平均帧率。然后可以在写入视频文件时使用此估计值。

3.) 我发现生成的视频的大小可能与原始视频的大小有很大不同,这取决于几个因素,最重要的是所选视频fps与实际原始帧速率的接近程度。

4.) 至于其他字体,有几种可用。我可以参考这个问题来快速了解一下。以下是相关文档:

fontFace – Font type. One of FONT_HERSHEY_SIMPLEX, 
FONT_HERSHEY_PLAIN, 
FONT_HERSHEY_DUPLEX, 
FONT_HERSHEY_COMPLEX, 
FONT_HERSHEY_TRIPLEX, 
FONT_HERSHEY_COMPLEX_SMALL, 
FONT_HERSHEY_SCRIPT_SIMPLEX, or 
FONT_HERSHEY_SCRIPT_COMPLEX, 
where each of the font ID’s can be combined with FONT_HERSHEY_ITALIC to get the slanted letters.
于 2012-09-08T17:45:27.117 回答
1

使用hach​​oir-metadata读取视频文件的元数据(包括帧率、高度和宽度。

输入:

from hachoir_core.error import HachoirError
from hachoir_core.cmd_line import unicodeFilename
from hachoir_parser import createParser
from hachoir_core.tools import makePrintable
from hachoir_metadata import extractMetadata
from hachoir_core.i18n import getTerminalCharset
from hachoir_metadata.metadata_item import QUALITY_BEST

功能:

def metaDataFile(filePath):
    filename, realname = unicodeFilename(filePath), filePath
    parser = createParser(filename, realname)
    try:
        metadata = extractMetadata(parser, QUALITY_BEST)
    except HachoirError, err:
        print "Metadata extraction error: %s" % unicode(err)
        metadata = None
    if not metadata:
        print metadata
        print "Unable to extract metadata"
        exit(1)
    return metadata

用法:

metadata = metaDataFile(videoPath)
width = metadata.get('width')
height = metadata.get('height')
fps = metadata.get('frame_rate')

查看相关属性:

for data in sorted(metadata):
    if len(data.values ) > 0:
        print data.key, data.values[0].value
于 2012-09-11T08:33:47.570 回答