1

我第一次尝试使用亚马逊预测。

阅读文档后,我想手动填充数据集中的缺失值。我想确保亚马逊能够很好地理解我发送的内容。

我的缺失值主要分为两类:

  • 商品有库存但未售出的天数(实数 0)
  • 商品缺货且未售出的天数(根据亚马逊文档为 NaN)

所以在我的数据集中,我做了这个:

+---------+------------+--------+
| item_id | timestamp  | demand |
+---------+------------+--------+
|     299 | 2020-01-01 | 0      |
|     320 | 2020-01-01 | NaN    |
+---------+------------+--------+

亚马逊会理解NaN我包含在数据集中的字符串吗?我无法从文档中了解 NaN 是否只是 Amazon 可以用来自动填充缺失值的一种方法,或者我是否实际上可以将这些值包含在我的数据集中。

谢谢您的帮助

4

1 回答 1

0

NaN不应该是一个字符串,它应该是一个真正的NaN 对象。然后一定要调整填充逻辑,像这样:

{
    "AttributeName": "target_value",
    "FeaturizationPipeline": [
         {
             "FeaturizationMethodName": "filling",
             "FeaturizationMethodParameters": {
                 "aggregation": "sum",
                 "middlefill": "nan",
                 "backfill": "nan"
             }
         }
     ]
 }
于 2021-04-09T17:13:46.650 回答