-1

如何使用 Cloud ML 对功能进行 one-hot 编码?我必须在 TensorFlow 模型中执行此操作,还是可以在 Cloud ML SDK 本身中执行此操作?

4

2 回答 2

4

请注意,您需要更多的时间来选择您想要的表示类型 - k(或 one-hot)或稀疏之一。

features.categorical('passenger_count').one_of_k()

旁注,您可能还对数值列感兴趣,以及应用日志(通常对计数类型的特征有用)或通过分桶离散化的能力。

于 2016-09-30T16:47:25.070 回答
2

在预处理(CsvFeatures)中,使用:

features.categorical('passenger_count')

您还可以传入频率阈值,以避免在数据中出现频率太低的 one-hot 编码值。

于 2016-09-30T14:01:16.720 回答