0

我正试图让这个回购工作。我按照说明使用此脚本(取自同一个 repo)获取示例数据:

#!/usr/bin/env sh
# This script downloads the trained S2VT VGG (RGB) model,
# associated vocabulary, and frame features for the validation set.

echo "Downloading Model and Data [~400MB] ..."

wget --no-check-certificate https://www.dropbox.com/s/wn6k2oqurxzt6e2/s2s_vgg_pstream_allvocab_fac2_iter_16000.caffemodel
wget --no-check-certificate https://www.dropbox.com/s/20mxirwrqy1av01/yt_allframes_vgg_fc7_val.txt
wget --no-check-certificate https://www.dropbox.com/s/v1lrc6leknzgn3x/yt_coco_mvad_mpiimd_vocabulary.txt

echo "Organizing..."

DIR="./snapshots"
if [ ! -d "$DIR" ]; then
    mkdir $DIR
fi
mv s2s_vgg_pstream_allvocab_fac2_iter_16000.caffemodel $DIR"/s2vt_vgg_rgb.caffemodel"

echo "Done."

在下一步中,他们说我需要sample video frames and extract VGG features for the frames。我不完全确定如何做到这一点。我已按照Caffe 的说明进行操作,但功能的格式不同。

那么如何提取与 ? 格式相同的 VGG 特征yt_allframes_vgg_fc7_val.txt

4

1 回答 1

0

这个 repo 提供了从视频中提取 VGG 特征的脚本 - https://github.com/jesu9/VGGFeatExtract

特别是,请参阅脚本video_demo.py。这将输出 mat 文件,您必须将其转换为 txt 文件。

VGG 16 层模型和 prototxt 文件可在 - https://gist.github.com/ksimonyan/211839e770f7b538e2d8

于 2017-03-10T12:57:43.333 回答