假设我有 3 个实体:parent1 <- child -> parent2。我使用dfs()
并获得了我无法理解的功能MEAN(child.parent2.MEAN(child.num_feature))
。阅读文档我认为any_entity.MEAN
功能是“按实体分组然后应用平均值”,但现在这种方法不起作用
问问题
38 次
1 回答
0
深度特征合成通过“堆叠”现有特征来创建新特征。要了解此功能,让我们逐步了解如何计算此功能。
- 计算特征
MEAN(child.num_feature)
并将其添加到parent2
. - 将该特征(在 上定义
parent2
)加入child
. 这将创建一个parent2.MEAN(child.num_feature)
在 上定义的新功能child
。对`parent2 具有相同值的行将child
为此特征具有相同的值。 - 分组并
child
取parent
该特征的平均值。这创造了MEAN(child.parent2.MEAN(child.num_feature))
为了帮助澄清,让我们通过一个具体的例子
想象一下parent1
是一张客户表,child
是一张transactions
由您的客户组成的表格amount
,以及parent2
您销售的每个独特产品的表格。
为客户实体创建的特征MEAN(transactions.product.SUM(amount))
可以解释为“这个客户购买的产品的平均总销售额是多少”,例如“这个客户是否购买了已经售出很多的产品”。
于 2019-02-24T18:45:19.600 回答