3

我目前正在使用我自己的数据处理功能工具文档。到目前为止一切正常,但我一直在添加有趣的变量。出于某种原因,我无法让它工作,我不知道为什么。文档中的示例工作得很好。

创建实体集后,我试图获取特定产品的功能Classic Cars

## Add interesting values
es["products"]["PRODUCTLINE"].interesting_values=["Classic Cars"]

## Get features
feature_defs = ft.dfs(entityset=es,
                            target_entity="customers",
                            agg_primitives=["count"],
                            where_primitives=["count"],
                            trans_primitives=[],
                            features_only=True))

## Show features
feature_defs


OUT[1]: [<Feature: COUNTRY>, <Feature: CUSTOMERNAME>, <Feature: COUNT(transactions)>]

我期望的是一个计算包括经典汽车在内的交易数量的功能。不幸的是,它没有这样做。它也不适用于我尝试过的任何其他变量或值。

正如您在此处看到的,作业确实有效。

es["products"]["PRODUCTLINE"].interesting_values

OUT[2]: ['Classic Cars']

Classic Cars 是变量 PRODUCTLINE 的有效值:

es["products"].variables

OUT[3]: [<Variable: PRODUCTCODE (dtype = index)>,
 <Variable: PRODUCTLINE_ID (dtype = numeric)>,
 <Variable: PRODUCTLINE (dtype = categorical)>,
 <Variable: MSRP (dtype = numeric)>]

es["products"].df.PRODUCTLINE.head(2)

OUT[4]: S10_1678     Motorcycles
S10_1949    Classic Cars
Name: PRODUCTLINE, dtype: object

不知道我做错了什么,任何帮助将不胜感激!

如果您想复制它,这里是数据和代码:https ://drive.google.com/open?id=1NOeudbCkeZ66nSOZrhhBdd1jcAa1LDco

4

0 回答 0