问题标签 [featuretools]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
55 浏览

featuretools - 如何使用功能工具 get_pandas_data_slice

有人可以展示一个示例或就如何使用 featuretools.EntitySet.get_pandas_data_slice() 提供更多解释吗?我查看了 API 文档,但不清楚参数filter_entity_ids、index_eid实例

具体来说,我想将我的实体集过滤为一个子集,这种方法看起来很有希望。

0 投票
1 回答
2330 浏览

featuretools - 如何将深度特征合成应用于单个表

处理后,我的数据是一张表,其中有几列是特征,一列是标签。我想用它featuretools.dfs来帮助我预测标签。是否可以直接执行,还是需要将单个表拆分为多个?

0 投票
1 回答
656 浏览

featuretools - 如何使用 FeatureTools 通过交叉表中的特征来生成新特征?

特征交叉是一种在数据集中寻找非线性关系的非常常用的技术。如何使用 FeatureTools 通过交叉表中的特征来生成新特征?

0 投票
1 回答
503 浏览

featuretools - 如何决定将哪些原语用于 DFS?

我们如何决定要传递到特征工具中的深度特征合成的原语列表?

0 投票
1 回答
602 浏览

python - 带有附加参数的自定义聚合原语?

转换原语可以与其他参数一起正常工作。这是一个例子

输出:

但是,如果我像这样修改并制作成聚合原语:

我收到以下错误:

特征工具是否支持具有附加参数的自定义聚合原语?

0 投票
2 回答
1178 浏览

featuretools - 我们应该在特征工具中从 DFS 中排除目标变量吗?

在将数据帧作为实体集中的实体传递并在其上使用 DFS 时,我们是否应该从 DFS 中排除目标变量?在传统的特征选择方法手动尝试并使用特征工具查看它是否提高了分数后,我有一个 roc_auc 分数为 0.76 的模型。所以在包含目标变量的实体集上使用了 DFS。令人惊讶的是,roc_auc 分数上升到 0.996,准确度上升到 0.9997,所以我对分数表示怀疑,因为我将目标变量以及深度特征合成传递给了与目标相关的信息可能已泄露到训练中?我假设正确吗?

0 投票
1 回答
386 浏览

featuretools - 在单个表上的滞后特征上使用特征工具

我经常看到使用特征工具创建聚合的建议范例是通过关系链接单独的实体。

现在,我的情况有点不同,我有一个看起来像这样的表

基本上,我将相同功能的滞后版本放在同一张表的不同列中。

在这种情况下我可以用什么方式使用功能工具?

0 投票
1 回答
889 浏览

featuretools - 特征工具的截止时间和训练窗口

假设我有两个数据集(对应于我的实体集中的两个实体):

第一个:customers (cust_id, name,birthdate, customer_since)
第二个:bookings (booking_id, service, chargeamount, booking_date)

现在我想创建一个数据集,其中包含从所有客户(无论他们何时成为客户)构建的特征,但只有过去两年的预订

我必须如何使用“last_time_index”?我可以只为一个实体设置“last_time_index”吗?在这种情况下,仅适用于预订实体,因为我想要所有客户,但不是所有预订。

如果使用此代码创建功能:

0 投票
1 回答
225 浏览

featuretools - 使用 FeatureTools 到带有时间戳的 normalize_entity 时无法转换列

我正在尝试使用 FeatureTools 来规范化特征合成表。我的表格类似于 Max-Kanter 在How to apply Deep Feature Synthesis to a single table 中的回复。我遇到了一个例外,我希望能得到一些帮助。

异常起源于featuretools.entityset.entity.entityset_convert_variable_type,它似乎不处理时间类型。

异常的性质是什么,我可以解决它吗?

表,df

我的代码:

ScheduledDay 和 AppointmentDay 是类型pandas._libs.tslib.Timestamp,就像Max-Kanter 的响应中的情况一样。

例外:

功能工具==0.1.21

该数据集来自Kaggle Show or No Show 比赛

0 投票
1 回答
173 浏览

featuretools - 如果我们不指定,DFS 是否采用默认原语?

  1. 如果我们不指定要在 DFS 中使用的原语列表,它会采用所有可能的原语吗?
  2. 如果我只给出 agg_primitives 列表而不是 trans 原语,它是否会考虑我提供的聚合列表和 trans 的所有默认原语?或者它根本不会做任何反式原语并且只使用agg?