问题标签 [featuretools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
feature-extraction - 在 Featuretools 中计算多个训练窗口的特征
我有一张桌子,上面有客户和交易。有没有办法获得在过去 3/6/9/12 个月内被过滤的功能?我想自动生成功能:
- 过去 3 个月的跨性别人数
- ……
- 过去 12 个月的跨性别人数
- 过去 3 个月的平均跨性别
- ...
- 过去 12 个月的平均跨性别
我试过使用training_window =["1 month", "3 months"],
,但它似乎没有为每个窗口返回多个功能。
例子:
我是否必须单独执行单个窗口然后合并结果?
featuretools - 特征工具实体集中的错误
使用 featuretools 定义实体集时收到以下错误消息:
AttributeError:“str”对象没有属性“copy”
这是我的代码:
以前有人遇到过同样的问题吗?
featuretools - 为什么实体索引显示为 id 而不是索引
下面定义了一个EntitySet。我已在事务表上声明did
为,但它注册为,而不是。这是为什么?Index
tx
Id
Index
目标是删除下面的警告。
在什么情况下,Index
分配将被覆盖为(主键与外部键?),并且注册为与警告相关Id
的事实?did
Id
一个表中uid
可以有多个did
s tx
。
这就是 EntitySet 的样子
为什么我打电话时did
显示为Id
而不是?Index
fts
这是警告:
featuretools - 你可以合并特征工具中的实体吗?
是否可以合并实体集中的实体,例如熊猫中的数据框?与规范化实体相反的东西。
如果我有以下es:
我正在寻找这样的功能来合并实体:
我会得到以下输出:
python-3.x - 具有单个表和 Min 原语的 Featuretools 会出错
我的环境是:
我的熊猫数据框看起来像:
我尝试了以下方法:
这给出了以下内容:
到目前为止一切顺利......现在如果我添加“Min”原语,我得到:
我希望看到每个列特征的最小值(就像 Log10 原语一样)。当然我可以定义自己的 Min 原语,但我希望有一个简单的解决方案。
查尔斯
featuretools - 升级后运行 Featuretools dfs 时出现“IndexError: Too many levels”
从 v0.1.21 升级到 v0.2.x 和 v0.3.0 后,Featuretools的dfs()
方法无法在我的实体集上运行。
当 Pandas 后端尝试计算聚合特征时会引发错误_calculate_agg_features()
。尤其是:
这在 v0.1.x 中运行良好,并且实体集在升级后没有改变。实体集由 7 个实体和 6 个关系组成。每个实体(数据框)都是通过添加的entity_from_dataframe
。
featuretools - 了解特征工具中的 PercentTrue 原始输出
我一直在玩predict-appointment-noshow 笔记本教程,但我对PERCENT_TRUE
原语的输出感到困惑。
我的理解是,在特征生成之后,像这样的列locations.PERCENT_TRUE(appointments.sms_received)
给出了为真的行的百分比sms_received
,给定一个位置,该位置在Entity
之前被定义为它自己的位置。我希望该列对于单个位置的所有行都是相同的,因为这是它的条件,但我发现情况并非如此。任何想法为什么?
这是该笔记本数据中的一个示例来演示:
即使位置仅限于'HORTO'
,列的范围为 0.00-0.31。这是如何计算的?
featuretools - 如何在特征工具中获取列名列表
如何获取功能工具中的列名列表。
在熊猫数据框中,我只需键入此代码
返回列名列表
但是,我尝试在实体集中执行此操作但失败了。我应该将实体集转换为数据框吗?
我现在通过将变量转换为字符串并执行正则表达式来获取变量的名称来做到这一点。但是,我相信有更好的方法来做到这一点。
谢谢你,
python - Featuretools:即使没有与日期时间相关的列,是否可以将其应用于单个表以生成特征?
featuretools文档在其第一句话中指出:
“Featuretools 是一个执行自动化特征工程的框架。它擅长将时间和关系数据集转换为机器学习的特征矩阵。”
这似乎意味着数据集必须有一个日期时间列。我只是想让它确认事实确实如此。也就是说,例如,我不能在“iris”数据集上使用它来生成新特征?如果数据集不需要时间变量,我将如何使用它在“iris”数据集上生成特征。我将不胜感激。谢谢。
python - Featuretools 处理多个连接键
特征工具中如何表示具有多个连接键的一对多关系?是否有一些集成方法 - 或者是否应该手动将连接键连接到单个列中?