0

用 Python 进行营销分析的特征工程

我有一个带有变量的数据offer_id(例如 1,2,5,10....)和product_id(例如 6178,4184,5124,...)。一个offer_id可以适用于多个product_id

我如何为每个 product_id 创建一个单独的变量,这样如果一个特定offer_id的变量适用于它,那么product_id变量得到一个值 1,否则它得到一个值 0。

每个 product_id 的单独变量的值必须为 0 或 1。值 0 表示offer_id不适用,值 1 表示相应offer_id适用。

4

1 回答 1

0

您可以通过为每种商品类型映射简单函数来创建新列,以检查 offer_id 列中的值。(如果 value == 5 返回 1,否则返回 0 等)。

同样,您可以使用np.where来实现相同的目的。即通过对offer_id 列进行条件检查来创建新列。

例如:df['is_5'] = np.where(df.offer_id == 5, 1, 0)

(即如果offer_id == 5,则返回1,否则返回0)。

于 2019-10-02T10:59:33.533 回答