问题标签 [fpgrowth]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
478 浏览

java - weka.associations.fpgrowth:无法处理任何类属性

在将我的属性从名义属性转换为 FPGrowth 的二进制文件时,我在 weka 中遇到了这个错误。数据集包含所有标称值 14:06:56:weka.associations.fpgrowth:无法处理任何类属性!

0 投票
0 回答
265 浏览

python - FP 增长(频繁模式挖掘)使用 Pyspark 给出错误

我一直在尝试使用频繁模式挖掘算法,如 PySpark 示例中所示。该代码曾经工作。

资源:

https://spark.apache.org/docs/2.2.0/ml-frequent-pattern-mining.html

我收到 .fit 的错误:

我用:

  • 火花 2.3.0
  • 爪哇 9

我该如何解决?​</p>

0 投票
1 回答
98 浏览

r - 如何使用应用函数而不是 R 中的循环来使用增长率

假设我有一个包含 3 列的数据框“国家”:

  • 年(从 2000 年到 2017 年)
  • 国内生产总值
  • 人口

我的目标是根据假设在未来五年内增加 GDP 和人口。我开发了以下循环:

其中 hypo_gdp 和 hypo_pop 是我的增长假设。

在这种情况下,有没有办法使用其中一个 apply() 函数?

提前致谢!

0 投票
1 回答
827 浏览

r - R中的fpgrowth错误

我正在尝试在名为 Adult 的内置数据集上拟合 fpgrowth 模型。在拟合模型时,我收到如下所示的错误。

我使用下面的 R 代码来拟合 fpgrowth 模型。

上面的代码有什么问题?

提前致谢。

0 投票
2 回答
3103 浏览

apache-spark - PySpark :: FP-growth algorithm (raise ValueError("Params must be either a param map or a list/tuple of param maps, ")

我是 PySpark 的初学者。我在 PySpark 中使用 FPgrowth 计算关联。我按照以下步骤操作。

数据示例

我抬头看了看,但我不知道出了什么问题。唯一可能我可以指出我将 RDD 转换为数据帧。

谁能指出我做错了什么?

0 投票
1 回答
721 浏览

apache-spark - 最大模式长度 fpGrowth (Apache) PySpark

我正在尝试使用 PySpark 运行关联规则。我首先创建一个 FPGrowth 树并将其传递给关联规则方法。

但是,我希望添加一个最大模式长度参数,以限制我想要在 LHS 和 RHS 上的项目数量。对于项目之间的关联,我只想将模式长度保持为 2。

生成的关联规则是非常长的模式。我想将长度保持在 2 种可能更多的模式。现在我要解释或理解的太多了。

有没有办法可以限制 PySPark 中的模式长度?我在 scala 中找到了 scala模式长度的链接,但在 PySaprk 中没有这样的链接。

如果您能在这种情况下建议/帮助我,我将不胜感激。提前致谢 !!!

0 投票
0 回答
519 浏览

python-3.x - 如何从 Pyspark 中的 FPGrowth 算法中获取前因/后因?

我如何误用/误读 Pyspark 中 FPGrowth 算法的使用,我有一个 Apriori 算法输出,我希望是一样的。提供的是我的 FPGrowth 代码、我的 Apriori 输出和我的 FPGrowth 输出。

先验输出: 在此处输入图像描述

FP增长输出:

在此处输入图像描述

我是误解了结果还是有另一种方法可以输出 FPGrowth 以便能够像 Apriori 一样解释结果?

为了进行测试,我将 Weka 用于 FPGrowth 并得到类似于 Apriori 的结果,因此表明我的 Pyspark 输出方法不正确,但文档中的结果始终是 fi:print(fi),所以我不确定如何。

Weka FPGrowth 输出: 在此处输入图像描述

0 投票
1 回答
772 浏览

scala - Spark Scala FPGrowth 没有任何结果?

我正在尝试使用 Scala 从 Spark MLLib 中获取一些频繁的项目集和关联规则。但实际上我什么也没得到,甚至没有错误。可以在此处找到代码(spark/databricks 笔记本)和数据输入文件

该算法要么没有找到任何频繁项集和/或关联规则,但有一些证据表明这是错误的。我对 KNIME(一个非编程分析平台)做了同样的事情,但使用 Borgelt 算法进行关联规则学习。在那里,我得到了带有升力和所有其他所需比率的前因、后因映射。但是在使用 Scala 的 Spark 中,我什么也得不到。

这段代码的输出是:

任何想法,将不胜感激。

0 投票
0 回答
302 浏览

scala - Spark Scala:将 Row 的 RDD 转换为 Basket 的 RDD

我正在尝试运行 FPGrowth,但实际上我遇到了输入类型的问题。给定代码:

这会产生以下输出:

代码继续转换为 RDD 并执行 FPGrowth

然后 Spark 告诉我:

然后我试图映射数据框

但这会导致另一个问题:

如何将类型参数 (T) 推断为 getAs List 命令?

或者有没有人有另一个好主意如何实际解决需要一个篮子的 RDD 但有一个 RDD 的 Rows 的问题?

谢谢你们

0 投票
1 回答
91 浏览

mysql - 如何将 RapidMiner 中的关联规则存储到 MySQL 表中

我需要将 fp-growth 关联规则从 RapidMiner 导出到 MySQL 数据库。该表包含以下列:premisesconclusion和。supportconfidence

我应该使用哪个运算符?