data-science - Google 的 AutoML Table 是否会在训练/评估之前对我的数据样本进行洗牌？

Question

我浏览了文档，但仍然不知道该服务是否在训练/评估之前对数据进行了洗牌。我需要知道这一点，因为数据是时间序列，这对于评估早期样本上的训练模型是现实的。

有人可以让我知道答案或指导我如何解决这个问题吗？我知道我可以导出评估结果并对其进行调整，但 BigQuery 似乎不尊重原始数据的顺序，并且数据中没有绝对的时间特征。

score 1 · Accepted Answer

它不会洗牌，而是拆分它。

看看这里：关于控制数据拆分。它说：

默认情况下，AutoML Tables 会随机选择 80% 的数据行用于训练，10% 用于验证，10% 用于测试。

如果您的数据对时间敏感，则应使用时间列。

通过使用它，AutoML Tables 将使用最早的 80% 的行进行训练，接下来的 10% 的行进行验证，以及最新的 10% 的行进行测试。

1 回答 1