0

我正在使用时间序列 AutoML 模型测试 Google Cloud Vertex AI。

我从 Biguery 表创建了一个数据集,其中包含 2 列,其中一个是时间戳,另一个是我想要预测的数值:

在此处输入图像描述

salesorderdate是我的TIMESTAMP专栏,orders是我想要预测的值。

当我继续下一步时,我无法选择orders要预测的值,此字段没有可用选项:

在此处输入图像描述

我在这里想念什么?在这种情况下,时间序列值肯定目标值吗?这里是否期望更多字段,并且实际上可以通过这种方式将附加特征作为列添加到时间序列模型中吗?

4

2 回答 2

1

我从您的问题中猜想您正在使用“预测模型”。请注意,它正处于“预览”产品发布阶段,因此会产生所有后果。

在文档中,您可能会找到以下信息训练数据结构:

  • 必须至少有两列且不超过 1,000 列。

对于训练 AutoML 模型的数据集,必须有一列作为目标,并且必须至少有一个特征可用于训练模型。如果训练数据不包含目标列,Vertex AI 无法将训练数据与所需结果相关联。

我想您正在使用 AutoML 模型,因此在这种情况下,您需要在数据集中有 3 列:

  • 时间列 - 用于按时间放置该行表示的观察
  • 时间序列标识符列为“预测训练数据通常包含多个时间序列”
  • 目标列是模型应该学习预测的值。

如果要预测orders这应该是目标列。但在您选择此目标之前,此“时间序列标识符列”已在上一步中选择,因此您没有可用的列可供选择。

因此,您需要向 BigQuery 表中添加至少一个额外的列,该列将用作时间序列列。您可以在每行中添加具有相同值的数据集列。预测数据准备最佳实践中介绍了此概念:

您可以在单个时间序列上训练预测模型(换句话说,时间序列标识符列包含所有行的相同值)。但是,Vertex AI 更适合包含两个或更多时间序列的训练数据。为获得最佳结果,用于训练模型的每列至少应有 10 个时间序列。

于 2021-06-28T14:08:58.667 回答
-1

根据 AutoML,目标列不能为空。

目标列的要求

目标列必须符合以下要求:

  • 它必须是分类或数值。
  • 如果它是分类的,它必须至少有 2 个且不超过 500 个不同的值。
  • 它不能为空
于 2021-07-06T23:28:21.840 回答