1

只要我在下面的代码中的 es.entity_from_dataframe(..) 中输入 time_index='date' 参数,ft.dfs(..) 就会抛出从 Type Error 开始的一长串错误。我正在使用 google colab 和 featuretools 版本 0.4.1。

import pandas as pd

import featuretools as ft

df1 = pd.DataFrame({'df_index' : [1,2,3,4,5],
                 'location':['aust','aust','aust','canada','canada'],
                  'prices':[34,52,46,25,67],
                   'values':[786,345,123,654,841]
                  })

es = ft.EntitySet(id='Transactions')

es.entity_from_dataframe(entity_id='log', 
                         dataframe=df1, 
                         index='df_index',
                         time_index='date'
                        )

es.normalize_entity(base_entity_id='log', new_entity_id='loc', index= 'location' )


fm, features = ft.dfs(entityset=es, target_entity='log',
                      trans_primitives = ['add', 'multiply'],
                      agg_primitives = ['sum', 'mean'],
                      max_depth = 2,
                      verbose = 2
                     )
4

1 回答 1

1

Colab 目前捆绑了 featuretools 0.4.1,我怀疑您正在使用更新的 API。我会先升级 featuretools 库,如下所示:

!pip install -U featuretools

之后,您需要使用 Runtime -> Restart 菜单重新启动 Python 进程。

在此处输入图像描述

然后,您会看到一个不同的错误,例如:

LookupError: Time index not found in dataframe

但是,我认为那是因为您引用了dateDataFrame 变量中不存在的列df1

于 2019-02-10T18:19:50.123 回答