问题标签 [mlxtend]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Mlxtend apriori 没有为稀疏矩阵创建 dtypes
我一直在尝试使用稀疏矩阵进行关联规则挖掘,但它一直在抛出AttributeError: dtypes not found
. 我知道错误的含义,但我无法解决它。这就是我所拥有的:
结果:
直到这里一切都很好并且工作正常,但是当我运行下一个块时,它会弹出错误。
我已经在其他问题中检查了该问题的其他“解决方案”,但没有一个对我有用。
整个错误
python - 类型错误:“模块”对象不能使用带有 mlxtend 的 fpgrowth 算法调用
from mlxtend.frequent_patterns import fpgrowth #使用FP增长算法
#数字
频繁项集_fp_num=fpgrowth(num, min_support=0.01, use_colnames=True)
嗨,我尝试将 fpgrowth 与 mlxtend 一起使用,但出现错误“模块”对象不可调用。我尝试使用“pip install git+git://github.com/rasbt/mlxtend.git”,但两者都没有。请问我有什么建议可以解决这个问题。
谢了。
python - sql server ML 服务为大数据提供低内存错误(关联规则挖掘项目)
我有一个项目,我想在购物车中查找商品之间的关联规则。为此,我使用 Sql Server 中的 ML 服务(Python),并使用mlxtend
库查找关联规则。但是问题我有的是该fpgrowth
函数显然使用了大量内存,以至于它停止工作并给出错误。尽可能使用sql server进行数据预处理以提高效率。
部分代码:
蟒蛇代码:
错误:内存错误
项目中使用的工具:
有没有解决方案可以更有效地做到这一点并避免错误?
python - 如何向每个用户显示关联规则结果
我用 python 和MLxtend
库和FG grows
算法实现了一个推荐系统。我在给用户的建议部分有问题。我想知道建议的解决方案是什么。
例如:规则结果来自mlxtend.FG_grows
现在我想使用用户购物篮提供该产品
用户购物篮数据:
现在我创建了用户篮子的所有状态然后加入dbo.rules
结果。
创建所有状态:
我认为这不是最佳方式。是否有 Python 函数或更好的解决方案?
python - 管道各个部分中的 ColumnTransformer(s) 不能很好地发挥作用
我正在使用sklearn
并mlxtend.regressor.StackingRegressor
构建一个堆叠回归模型。例如,假设我想要以下小管道:
- 具有两个回归量的堆叠回归量:
- 一个管道,它:
- 执行数据插补
- 1-hot 编码分类特征
- 执行线性回归
- 一个管道,它:
- 执行数据插补
- 使用决策树执行回归
- 一个管道,它:
不幸的是,这是不可能的,因为StackingRegressor
不接受NaN
其输入数据。即使它的回归器知道如何处理NaN
也是如此,因为在我的情况下,回归器实际上是执行数据插补的管道。
但是,这不是问题:我可以将数据插补移到堆叠回归器之外。现在我的管道看起来像这样:
- 执行数据插补
- 应用具有两个回归量的堆叠回归量:
- 一个管道,它:
- 1-hot 编码分类特征
- 标准化数字特征
- 执行线性回归
- 一个
sklearn.tree.DecisionTreeRegressor
。
- 一个管道,它:
可以尝试按如下方式实现它(本要点中的整个最小工作示例,带有注释):
请注意,“外部” ColumnTransformer
(in stacked_regressor
)返回一个numpy
矩阵。但是“内部” ColumnTransformer
(in sr_linear
)需要 a pandas.DataFrame
,所以我不得不使用 step 将矩阵转换回数据框back_to_pandas
。(要使用get_feature_names_out
我必须使用 sklearn 的 nightly 版本,因为当前稳定的 1.0.2 版本还不支持它。幸运的是它可以通过一个简单的命令安装。)
上面的代码在调用时失败stacked_regressor.fit()
,出现以下错误(整个堆栈跟踪再次在gist中):
但是,因为我在back_to_pandas
外部管道中添加了该步骤,所以内部管道应该得到一个 pandas 数据框!事实上,如果我只是fit_transform()
我的ct_imputation
对象,我清楚地获得了一个熊猫数据框。我无法理解传递的数据究竟在何时何地不再是数据框。为什么我的代码失败了?