我正在尝试在 Auto ML Video Intelligence Classification 上创建自定义模型,并不断收到上述错误。这不是一个视频剪辑的问题,因为如果我尝试使用相同的 CSV,我会收到包含不同视频的错误消息。CSV 是在 excel 中创建的,第一列是 TRAIN 或 TEST,第二列是视频 URI。
2 回答
根据文档,您需要创建两级 CSV:
- 将指向 TRAIN 和 TEST 数据 csv 的初始 csv
- csv 由最初的引用。在这里,我们有一个用于 TRAIN 的 csv 和另一个用于 TEST 的 csv,这些 csv 的行引用了视频。
让我们更深入地看一下:
1. 您的第一个 csv 必须与以下类似:
训练,gs://automl-video-demo-data/hmdb_split1_5classes_train.csv
测试,gs://automl-video-demo-data/hmdb_split1_5classes_test.csv
或者
未签名,gs://automl-video-demo-data/hmdb_split1_5classes_all.csv
在哪里:
- 训练数据:用于训练模型。包含视频文件的路径、视频片段的开始和结束时间以及标识视频片段主题的标签。如果您指定训练数据 CSV 文件,则还必须指定测试数据 CSV 文件。
- 测试数据:用于在训练阶段测试模型。包含视频文件的路径、视频片段的开始和结束时间以及标识视频片段主题的标签。如果您指定测试数据 CSV 文件,则还必须指定训练数据 CSV 文件。
- 未分配数据:用于训练和测试模型的 sed。包含视频文件的路径、视频片段的开始和结束时间以及标识视频片段主题的标签。未分配文件中的行自动分为训练数据和测试数据。80% 用于训练,20% 用于测试。您可以仅指定未分配的数据 CSV 文件,而不指定训练和测试数据 CSV 文件。您还可以仅指定训练和测试数据 CSV 文件,而不指定未分配的数据 CSV 文件。
2. 您的 TRAIN、TEST 和 UNASSIGNED 文件必须包含以下信息:
要分类或注释的内容。此字段包含视频的 Google Cloud Storage URI。Google Cloud Storage URI 区分大小写。
标识视频分类方式的标签。. 标签必须以字母开头,并且只能包含字母、数字和下划线。您可以通过在 CSV 文件中添加多行来为视频指定多个标签,每行标识相同的视频片段,每行具有不同的标签。
视频片段的开始和结束时间。这两个以逗号分隔的字段标识要分析的视频片段的开始和结束时间,以秒为单位。开始时间必须小于结束时间。这两个值都必须是非负的并且在视频的时间范围内。例如,0.09845,1.3600555。要使用视频的全部内容,请指定 0 的开始时间和视频全长或“inf”的结束时间。例如,0,inf。
文件中的一行示例:
gs://<your-video-path>/vehicle.mp4,mustang,0,5.4
在哪里:
- gs:///vehicle.mp4是视频的路径
- 野马是标签
- 0是视频中的开始时间
- 5.4是视频中的结束时间
我得到了同样的错误,通过这样做它为我解决了。在保存 CSV 文件时,检查是否选择了编码为“UTF-8”。如果不保存为“UTF-8”。