0

我正在尝试在 Auto ML Video Intelligence Classification 上创建自定义模型,并不断收到上述错误。这不是一个视频剪辑的问题,因为如果我尝试使用相同的 CSV,我会收到包含不同视频的错误消息。CSV 是在 excel 中创建的,第一列是 TRAIN 或 TEST,第二列是视频 URI。

4

2 回答 2

1

根据文档,您需要创建两级 CSV:

  1. 将指向 TRAIN 和 TEST 数据 csv 的初始 csv
  2. csv 由最初的引用。在这里,我们有一个用于 TRAIN 的 csv 和另一个用于 TEST 的 csv,这些 csv 的行引用了视频。

让我们更深入地看一下:

1. 您的第一个 csv 必须与以下类似:

训练,gs://automl-video-demo-data/hmdb_split1_5classes_train.csv
测试,gs://automl-video-demo-data/hmdb_split1_5classes_test.csv

或者

未签名,gs://automl-video-demo-data/hmdb_split1_5classes_all.csv

在哪里:

  1. 训练数据:用于训练模型。包含视频文件的路径、视频片段的开始和结束时间以及标识视频片段主题的标签。如果您指定训练数据 CSV 文件,则还必须指定测试数据 CSV 文件。
  2. 测试数据:用于在训练阶段测试模型。包含视频文件的路径、视频片段的开始和结束时间以及标识视频片段主题的标签。如果您指定测试数据 CSV 文件,则还必须指定训练数据 CSV 文件。
  3. 未分配数据:用于训练和测试模型的 sed。包含视频文件的路径、视频片段的开始和结束时间以及标识视频片段主题的标签。未分配文件中的行自动分为训练数据和测试数据。80% 用于训练,20% 用于测试。您可以仅指定未分配的数据 CSV 文件,而不指定训练和测试数据 CSV 文件。您还可以仅指定训练和测试数据 CSV 文件,而不指定未分配的数据 CSV 文件。


2. 您的 TRAIN、TEST 和 UNASSIGNED 文件必须包含以下信息:

  1. 要分类或注释的内容。此字段包含视频的 Google Cloud Storage URI。Google Cloud Storage URI 区分大小写。

  2. 标识视频分类方式的标签。. 标签必须以字母开头,并且只能包含字母、数字和下划线。您可以通过在 CSV 文件中添加多行来为视频指定多个标签,每行标识相同的视频片段,每行具有不同的标签。

  3. 视频片段的开始和结束时间。这两个以逗号分隔的字段标识要分析的视频片段的开始和结束时间,以秒为单位。开始时间必须小于结束时间。这两个值都必须是非负的并且在视频的时间范围内。例如,0.09845,1.3600555。要使用视频的全部内容,请指定 0 的开始时间和视频全长或“inf”的结束时间。例如,0,inf。

文件中的一行示例:

gs://<your-video-path>/vehicle.mp4,mustang,0,5.4

在哪里:

  • gs:///vehicle.mp4是视频的路径
  • 野马是标签
  • 0是视频中的开始时间
  • 5.4是视频中的结束时间
于 2020-06-16T10:25:13.707 回答
0

我得到了同样的错误,通过这样做它为我解决了。在保存 CSV 文件时,检查是否选择了编码为“UTF-8”。如果不保存为“UTF-8”。

于 2020-09-24T07:34:20.770 回答