0

我基于一些 CSV 文件在 Vertex AI / Datasets 中创建了表格数据集。但是,当我尝试在 AutoML 中使用这些数据集进行训练和预测时,无法指定字段的数据类型。在文档中,我找不到如何进行“转换”。理论上它支持以下类型:

  • 文本
  • 分类的
  • 数字
  • 时间戳

对于 BigQuery 表,获取数据类型非常明显,因为它由表的架构明确指定。然而,在 CSV 文件的情况下,有时找出字段的类型并不明显,而且在我的情况下,有时 AutoML 会猜错。任何想法如何为 CSV 文件明确指定数据类型?

4

1 回答 1

0

用于 Vertex AI 的 Google Cloud Python SDK 不支持列数据类型的转换。目前只能通过 Cloud Console 完成。

将数据导入 Vertex AI 数据集并创建训练管道后,它会自动检测和分析提供的 CSV 文件,并提供有关各种数据类型的信息,如下图所示。数据类型的转换发生在数据导入之后。

如果 Vertex AI 错误识别数据类型,我们可以使用下拉菜单将其更改为所需的数据类型,如下图所示。有关使用 Vertex AI 构建和训练模型的演示,请参阅此视频

在此处输入图像描述

于 2021-06-29T15:07:28.557 回答