问题标签 [fpgrowth]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - weka.associations.fpgrowth:无法处理任何类属性
在将我的属性从名义属性转换为 FPGrowth 的二进制文件时,我在 weka 中遇到了这个错误。数据集包含所有标称值 14:06:56:weka.associations.fpgrowth:无法处理任何类属性!
python - FP 增长(频繁模式挖掘)使用 Pyspark 给出错误
我一直在尝试使用频繁模式挖掘算法,如 PySpark 示例中所示。该代码曾经工作。
资源:
https://spark.apache.org/docs/2.2.0/ml-frequent-pattern-mining.html
我收到 .fit 的错误:
我用:
- 火花 2.3.0
- 爪哇 9
我该如何解决?</p>
r - 如何使用应用函数而不是 R 中的循环来使用增长率
假设我有一个包含 3 列的数据框“国家”:
- 年(从 2000 年到 2017 年)
- 国内生产总值
- 人口
我的目标是根据假设在未来五年内增加 GDP 和人口。我开发了以下循环:
其中 hypo_gdp 和 hypo_pop 是我的增长假设。
在这种情况下,有没有办法使用其中一个 apply() 函数?
提前致谢!
r - R中的fpgrowth错误
我正在尝试在名为 Adult 的内置数据集上拟合 fpgrowth 模型。在拟合模型时,我收到如下所示的错误。
我使用下面的 R 代码来拟合 fpgrowth 模型。
上面的代码有什么问题?
提前致谢。
apache-spark - PySpark :: FP-growth algorithm (raise ValueError("Params must be either a param map or a list/tuple of param maps, ")
我是 PySpark 的初学者。我在 PySpark 中使用 FPgrowth 计算关联。我按照以下步骤操作。
数据示例
我抬头看了看,但我不知道出了什么问题。唯一可能我可以指出我将 RDD 转换为数据帧。
谁能指出我做错了什么?
apache-spark - 最大模式长度 fpGrowth (Apache) PySpark
我正在尝试使用 PySpark 运行关联规则。我首先创建一个 FPGrowth 树并将其传递给关联规则方法。
但是,我希望添加一个最大模式长度参数,以限制我想要在 LHS 和 RHS 上的项目数量。对于项目之间的关联,我只想将模式长度保持为 2。
生成的关联规则是非常长的模式。我想将长度保持在 2 种可能更多的模式。现在我要解释或理解的太多了。
有没有办法可以限制 PySPark 中的模式长度?我在 scala 中找到了 scala模式长度的链接,但在 PySaprk 中没有这样的链接。
如果您能在这种情况下建议/帮助我,我将不胜感激。提前致谢 !!!
scala - Spark Scala:将 Row 的 RDD 转换为 Basket 的 RDD
我正在尝试运行 FPGrowth,但实际上我遇到了输入类型的问题。给定代码:
这会产生以下输出:
代码继续转换为 RDD 并执行 FPGrowth
然后 Spark 告诉我:
然后我试图映射数据框
但这会导致另一个问题:
如何将类型参数 (T) 推断为 getAs List 命令?
或者有没有人有另一个好主意如何实际解决需要一个篮子的 RDD 但有一个 RDD 的 Rows 的问题?
谢谢你们
mysql - 如何将 RapidMiner 中的关联规则存储到 MySQL 表中
我需要将 fp-growth 关联规则从 RapidMiner 导出到 MySQL 数据库。该表包含以下列:premises
、conclusion
和。support
confidence
我应该使用哪个运算符?