我基于一些 CSV 文件在 Vertex AI / Datasets 中创建了表格数据集。但是,当我尝试在 AutoML 中使用这些数据集进行训练和预测时,无法指定字段的数据类型。在文档中,我找不到如何进行“转换”。理论上它支持以下类型:
- 文本
- 分类的
- 数字
- 时间戳
对于 BigQuery 表,获取数据类型非常明显,因为它由表的架构明确指定。然而,在 CSV 文件的情况下,有时找出字段的类型并不明显,而且在我的情况下,有时 AutoML 会猜错。任何想法如何为 CSV 文件明确指定数据类型?
我基于一些 CSV 文件在 Vertex AI / Datasets 中创建了表格数据集。但是,当我尝试在 AutoML 中使用这些数据集进行训练和预测时,无法指定字段的数据类型。在文档中,我找不到如何进行“转换”。理论上它支持以下类型:
对于 BigQuery 表,获取数据类型非常明显,因为它由表的架构明确指定。然而,在 CSV 文件的情况下,有时找出字段的类型并不明显,而且在我的情况下,有时 AutoML 会猜错。任何想法如何为 CSV 文件明确指定数据类型?
用于 Vertex AI 的 Google Cloud Python SDK 不支持列数据类型的转换。目前只能通过 Cloud Console 完成。
将数据导入 Vertex AI 数据集并创建训练管道后,它会自动检测和分析提供的 CSV 文件,并提供有关各种数据类型的信息,如下图所示。数据类型的转换发生在数据导入之后。
如果 Vertex AI 错误识别数据类型,我们可以使用下拉菜单将其更改为所需的数据类型,如下图所示。有关使用 Vertex AI 构建和训练模型的演示,请参阅此视频。