我目前正在使用我自己的数据处理功能工具文档。到目前为止一切正常,但我一直在添加有趣的变量。出于某种原因,我无法让它工作,我不知道为什么。文档中的示例工作得很好。
创建实体集后,我试图获取特定产品的功能Classic Cars
:
## Add interesting values
es["products"]["PRODUCTLINE"].interesting_values=["Classic Cars"]
## Get features
feature_defs = ft.dfs(entityset=es,
target_entity="customers",
agg_primitives=["count"],
where_primitives=["count"],
trans_primitives=[],
features_only=True))
## Show features
feature_defs
OUT[1]: [<Feature: COUNTRY>, <Feature: CUSTOMERNAME>, <Feature: COUNT(transactions)>]
我期望的是一个计算包括经典汽车在内的交易数量的功能。不幸的是,它没有这样做。它也不适用于我尝试过的任何其他变量或值。
正如您在此处看到的,作业确实有效。
es["products"]["PRODUCTLINE"].interesting_values
OUT[2]: ['Classic Cars']
Classic Cars 是变量 PRODUCTLINE 的有效值:
es["products"].variables
OUT[3]: [<Variable: PRODUCTCODE (dtype = index)>,
<Variable: PRODUCTLINE_ID (dtype = numeric)>,
<Variable: PRODUCTLINE (dtype = categorical)>,
<Variable: MSRP (dtype = numeric)>]
es["products"].df.PRODUCTLINE.head(2)
OUT[4]: S10_1678 Motorcycles
S10_1949 Classic Cars
Name: PRODUCTLINE, dtype: object
不知道我做错了什么,任何帮助将不胜感激!
如果您想复制它,这里是数据和代码:https ://drive.google.com/open?id=1NOeudbCkeZ66nSOZrhhBdd1jcAa1LDco