问题标签 [featuretools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
featuretools - 在实体上运行 dfs 后如何保留特征列?
我尝试了以下 URL 中提到的 Featuretools 示例:https ://docs.featuretools.com/index.html
客户数据框具有以下数据:
In [4]: customers_df
Out[4]:
customer_id zip_code join_date date_of_birth
0 1 60091 2011-04-17 10:48:33 1994-07-18
1 2 13244 2012-04-15 23:31:04 1986-08-18
在为数据中的每个创建特征矩阵后customer
,大约创建了 73 个特征,但特征/列join_date
并date_of_birth
没有保留在feature_matrix_customers
.
询问:
1)是否可以选择保留功能/列join_date
并date_of_birth
在feature_matrix_customers
2) Featuretools DFS 不会time
从和中提取join_date
或创建任何特征。有没有办法让小时、分钟、秒的特征类似于和特征列hours
mins
secs
year
month
date
python - 没有为我在功能工具中设置的实体集生成功能
我在尝试创建实体集之间的关系时遇到了一个问题(使用我自己的数据)。没有错误,但它只是没有为我的一个实体(“prods”实体)创建功能,尽管一切都应该连接得很好。
我不能分享我的数据,但我用一些模拟数据创建了一个最小的例子:
创建模拟数据
定义实体集
创建关系
生成特征
输出:
这也应该向我展示产品变量的功能,但事实并非如此。
所以我希望 SUM 将每个客户的产品价格相加。相反,什么都没有。
最终,我想为有趣的值创建特征。但是由于没有显示产品变量,因此添加有趣的值也不起作用。
输出:
希望有人可以提供帮助:)
featuretools - Jupyter 笔记本中没有名为“featuretools.features”的模块错误 pip install
当我尝试在 Jupyter 笔记本中使用 pip 从 featuretools.features 安装任何内容时,我收到此错误:
ModuleNotFoundError:没有名为“featuretools.features”的模块
我从 featuretools 导入的所有其他东西都在工作,所以我不确定为什么会这样。任何帮助都会很棒,谢谢!
featuretools - 使用演示时出现错误“group() got an unexpected keyword argument 'observed'”
我尝试了演示。当我运行 [in] feature_matrix, features_defs = ft.dfs(entityset=es, target_entity="customers")
我收到一条错误消息,例如这个 group() got an unexpected keyword argument 'observed'
期待您的帮助。谢谢。
python - 在 mac 上安装功能工具时出错
系统规格:
macOS 摩爪哇
版本:10.14.1 (18B75)
我正在尝试 featuretools
使用 pip 在 mac 上安装。
Featuretools 是一个 python 库,用于使用现有功能生成一组新功能。
使用的命令: python -m pip install featuretools
但我收到此错误:
有谁知道如何解决这个错误??
谢谢
python - AssertionError: Index is not unique on dataframe (Entity cust) using Featuretools
我有一个如下的数据框
我正在使用功能工具创建如下实体
但我得到了错误
然而 customerid 是标识符
python - 如何使用 Featuretools 按列值从单个数据框中的多列创建特征?
我试图根据早期的结果来预测足球比赛的结果。我在 Windows 上运行 Python 3.6 并使用 Featuretools 0.4.1。
假设我有以下代表结果历史的数据框。
使用上面的数据框,我想创建以下数据框,它将作为X输入机器学习算法。请注意,尽管过去的比赛场地,主队和客队的平均进球数都需要按球队计算。有没有办法使用Featuretools创建这样的数据框?
可以在此处找到用于模拟转换的 Excel 文件。
python - 这甚至意味着官方 featuretools 文档中的 SUM(sessions.MIN(transactions.amount)) 是什么意思?
有人可以帮助我了解深度特征合成自动创建的这种特征如何实际工作吗?我遇到了这么多创建的此类功能,但我不确定它是如何工作的。我无法在这里连接整个代码,尽管我确信阅读过官方功能工具文档的人都知道这个例子。希望看到回复!谢谢你的时间!
python - 根据特征工具中的截止时间创建特征
我正在使用功能工具,我需要创建一个使用截止时间进行计算的功能。
我的实体集包括一个客户表和一个订阅表(它有更多,但对于这个问题,只有这些是必要的):
客户表
子表
我使用 client_id 作为键并将 start_date 设置为 time_index 创建了实体集
出去:
现在,我需要创建一个功能来估计每个客户的截止时间(即 01/01/2018)和最近的 end_plan_date 之间的时间。以代数形式计算应该是
time_remaining_in_plan = max(subscription.end_plan_date - cutoff_time)
我还需要计算自客户端启动以来的时间量:
time_since_start = cutoff_time - client.start_date
在我的示例中,这些功能的预期输出应该如下所示(我假设时间差以天为单位,但也可能是几个月,我也使用截止时间的时间范围):
有没有办法使用特征工具来创建可以生成此结果的自定义原语(聚合或转换)或种子特征?
谢谢!!
featuretools - LookupError:在数据框中找不到时间索引
这是重现此问题的代码,但可以通过删除“订单”实体来避免。