2

我浏览了文档,但仍然不知道该服务是否在训练/评估之前对数据进行了洗牌。我需要知道这一点,因为数据是时间序列,这对于评估早期样本上的训练模型是现实的。

有人可以让我知道答案或指导我如何解决这个问题吗?我知道我可以导出评估结果并对其进行调整,但 BigQuery 似乎不尊重原始数据的顺序,并且数据中没有绝对的时间特征。

4

1 回答 1

1

它不会洗牌,而是拆分它。

看看这里:关于控制数据拆分。它说:

默认情况下,AutoML Tables 会随机选择 80% 的数据行用于训练,10% 用于验证,10% 用于测试。

如果您的数据对时间敏感,则应使用时间列

通过使用它,AutoML Tables 将使用最早的 80% 的行进行训练,接下来的 10% 的行进行验证,以及最新的 10% 的行进行测试。

于 2019-07-18T23:52:08.290 回答