使用带有 mlxtend apriori 的稀疏数据帧的问题。
我在 anaconda 中运行 python 2.7 并安装了 mlxtend。基于最新版本的 mlxtend,aprioir 类支持稀疏数据帧作为其输入。我有超过 50 万种产品要对其进行购物篮分析。我正在尝试使用一个小数据集创建一个 onehot 编码的稀疏数据帧来测试,但我在 mlextend apriori 函数内的稀疏数据帧上遇到了 df.to_coo() 问题。
请在此处找到代码、输入数据文件和错误 -
https://github.com/nshahHome/pycode
单击查看代码以查看文件。
code = code2.py input data file= mbtest.txt errors = code2-error.html(您可能需要下载此文件并在浏览器中打开)
我希望代码不会抛出错误并尝试创建频繁项集。如果没有集合 > min_support,则集合可能为空。