问题标签 [mlxtend]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
68 浏览

python - Mlxtend apriori 没有为稀疏矩阵创建 dtypes

我一直在尝试使用稀疏矩阵进行关联规则挖掘,但它一直在抛出AttributeError: dtypes not found. 我知道错误的含义,但我无法解决它。这就是我所拥有的:

结果:

直到这里一切都很好并且工作正常,但是当我运行下一个块时,它会弹出错误。

我已经在其他问题中检查了该问题的其他“解决方案”,但没有一个对我有用。

整个错误

0 投票
1 回答
129 浏览

python - 类型错误:“模块”对象不能使用带有 mlxtend 的 fpgrowth 算法调用

from mlxtend.frequent_patterns import fpgrowth #使用FP增长算法

#数字

频繁项集_fp_num=fpgrowth(num, min_support=0.01, use_colnames=True)

嗨,我尝试将 fpgrowth 与 mlxtend 一起使用,但出现错误“模块”对象不可调用。我尝试使用“pip install git+git://github.com/rasbt/mlxtend.git”,但两者都没有。请问我有什么建议可以解决这个问题。

谢了。

0 投票
1 回答
36 浏览

python - sql server ML 服务为大数据提供低内存错误(关联规则挖掘项目)

我有一个项目,我想在购物车中查找商品之间的关联规则。为此,我使用 Sql Server 中的 ML 服务(Python),并使用mlxtend库查找关联规则。但是问题我有的是该fpgrowth函数显然使用了大量内存,以至于它停止工作并给出错误。尽可能使用sql server进行数据预处理以提高效率。

部分代码:

蟒蛇代码:

错误:内存错误

项目中使用的工具:

有没有解决方案可以更有效地做到这一点并避免错误?

0 投票
0 回答
21 浏览

python - 如何向每个用户显示关联规则结果

我用 python 和MLxtend库和FG grows算法实现了一个推荐系统。我在给用户的建议部分有问题。我想知道建议的解决方案是什么。

例如:规则结果来自mlxtend.FG_grows

现在我想使用用户购物篮提供该产品

用户购物篮数据:

现在我创建了用户篮子的所有状态然后加入dbo.rules结果。
创建所有状态:

我认为这不是最佳方式。是否有 Python 函数或更好的解决方案?

0 投票
0 回答
13 浏览

pandas - MLXTEND 变换编码器未按预期工作

我正在尝试在数据帧系列上使用转换编码器,但它没有按预期工作。这是我正在使用的数据框(订单):

在此处输入图像描述

这是我正在尝试的代码

在此处输入图像描述

据我了解,store_menu_id 中的字符串被拆分为字符串中的字母。

我也尝试用列表而不是系列来安装编码器,但我仍然面临同样的问题。

任何关于为什么会发生这种情况的见解都会真正有帮助。

谢谢!

0 投票
2 回答
44 浏览

python - 管道各个部分中的 ColumnTransformer(s) 不能很好地发挥作用

我正在使用sklearnmlxtend.regressor.StackingRegressor构建一个堆叠回归模型。例如,假设我想要以下小管道:

  1. 具有两个回归量的堆叠回归量:
    • 一个管道,它:
      • 执行数据插补
      • 1-hot 编码分类特征
      • 执行线性回归
    • 一个管道,它:
      • 执行数据插补
      • 使用决策树执行回归

不幸的是,这是不可能的,因为StackingRegressor不接受NaN其输入数据。即使它的回归器知道如何处理NaN也是如此,因为在我的情况下,回归器实际上是执行数据插补的管道。

但是,这不是问题:我可以将数据插补移到堆叠回归器之外。现在我的管道看起来像这样:

  1. 执行数据插补
  2. 应用具有两个回归量的堆叠回归量:
    • 一个管道,它:
      • 1-hot 编码分类特征
      • 标准化数字特征
      • 执行线性回归
    • 一个sklearn.tree.DecisionTreeRegressor

可以尝试按如下方式实现它(本要点中的整个最小工作示例,带有注释):

请注意,“外部” ColumnTransformer(in stacked_regressor)返回一个numpy矩阵。但是“内部” ColumnTransformer(in sr_linear)需要 a pandas.DataFrame,所以我不得不使用 step 将矩阵转换回数据框back_to_pandas。(要使用get_feature_names_out我必须使用 sklearn 的 nightly 版本,因为当前稳定的 1.0.2 版本还不支持它。幸运的是它可以通过一个简单的命令安装。)

上面的代码在调用时失败stacked_regressor.fit(),出现以下错误(整个堆栈跟踪再次在gist中):

但是,因为我在back_to_pandas外部管道中添加了该步骤,所以内部管道应该得到一个 pandas 数据框!事实上,如果我只是fit_transform()我的ct_imputation对象,我清楚地获得了一个熊猫数据框。我无法理解传递的数据究竟在何时何地不再是数据框。为什么我的代码失败了?