假设我有两个数据集(对应于我的实体集中的两个实体):
第一个:customers (cust_id, name,birthdate, customer_since)
第二个:bookings (booking_id, service, chargeamount, booking_date)
现在我想创建一个数据集,其中包含从所有客户(无论他们何时成为客户)构建的特征,但只有过去两年的预订。
我必须如何使用“last_time_index”?我可以只为一个实体设置“last_time_index”吗?在这种情况下,仅适用于预订实体,因为我想要所有客户,但不是所有预订。
如果使用此代码创建功能:
feature_matrix, features = ft.dfs(entityset=es,
target_entity="customers",
cutoff_time= pd.to_datetime('30/05/2018'),
training_window = ft.Timedelta(2*365,"d"),
agg_primitives=["count"],
trans_primitives=["time_since","year"],
cutoff_time_in_index = True)