问题标签 [fpgrowth]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

52 问题

0 投票

1 回答

478 浏览

java - weka.associations.fpgrowth：无法处理任何类属性

在将我的属性从名义属性转换为 FPGrowth 的二进制文件时，我在 weka 中遇到了这个错误。数据集包含所有标称值 14:06:56：weka.associations.fpgrowth：无法处理任何类属性！

java machine-learning weka data-mining fpgrowth

2018-04-22T11:34:30.983

0 投票

0 回答

265 浏览

python - FP 增长（频繁模式挖掘）使用 Pyspark 给出错误

我一直在尝试使用频繁模式挖掘算法，如 PySpark 示例中所示。该代码曾经工作。

资源：

https://spark.apache.org/docs/2.2.0/ml-frequent-pattern-mining.html

我收到 .fit 的错误：

我用：

火花 2.3.0
爪哇 9

我该如何解决？</p>

python apache-spark pyspark rdd fpgrowth

2018-05-09T15:04:12.700

0 投票

1 回答

98 浏览

r - 如何使用应用函数而不是 R 中的循环来使用增长率

假设我有一个包含 3 列的数据框“国家”：

年（从 2000 年到 2017 年）
国内生产总值
人口

我的目标是根据假设在未来五年内增加 GDP 和人口。我开发了以下循环：

其中 hypo_gdp 和 hypo_pop 是我的增长假设。

在这种情况下，有没有办法使用其中一个 apply() 函数？

提前致谢！

r loops apply rate fpgrowth

2018-05-19T18:01:24.890

0 投票

1 回答

827 浏览

r - R中的fpgrowth错误

我正在尝试在名为 Adult 的内置数据集上拟合 fpgrowth 模型。在拟合模型时，我收到如下所示的错误。

我使用下面的 R 代码来拟合 fpgrowth 模型。

上面的代码有什么问题？

提前致谢。

r apriori fpgrowth

2018-06-19T11:14:48.943

0 投票

2 回答

3103 浏览

apache-spark - PySpark :: FP-growth algorithm (raise ValueError("Params must be either a param map or a list/tuple of param maps, ")

我是 PySpark 的初学者。我在 PySpark 中使用 FPgrowth 计算关联。我按照以下步骤操作。

数据示例

我抬头看了看，但我不知道出了什么问题。唯一可能我可以指出我将 RDD 转换为数据帧。

谁能指出我做错了什么？

apache-spark pyspark fpgrowth

2018-07-13T12:27:22.313

0 投票

1 回答

721 浏览

apache-spark - 最大模式长度 fpGrowth (Apache) PySpark

我正在尝试使用 PySpark 运行关联规则。我首先创建一个 FPGrowth 树并将其传递给关联规则方法。

但是，我希望添加一个最大模式长度参数，以限制我想要在 LHS 和 RHS 上的项目数量。对于项目之间的关联，我只想将模式长度保持为 2。

生成的关联规则是非常长的模式。我想将长度保持在 2 种可能更多的模式。现在我要解释或理解的太多了。

有没有办法可以限制 PySPark 中的模式长度？我在 scala 中找到了 scala模式长度的链接，但在 PySaprk 中没有这样的链接。

如果您能在这种情况下建议/帮助我，我将不胜感激。提前致谢！！！

apache-spark pyspark fpgrowth

2018-07-27T06:52:56.427

0 投票

0 回答

519 浏览

python-3.x - 如何从 Pyspark 中的 FPGrowth 算法中获取前因/后因？

我如何误用/误读 Pyspark 中 FPGrowth 算法的使用，我有一个 Apriori 算法输出，我希望是一样的。提供的是我的 FPGrowth 代码、我的 Apriori 输出和我的 FPGrowth 输出。

先验输出：

FP增长输出：

我是误解了结果还是有另一种方法可以输出 FPGrowth 以便能够像 Apriori 一样解释结果？

为了进行测试，我将 Weka 用于 FPGrowth 并得到类似于 Apriori 的结果，因此表明我的 Pyspark 输出方法不正确，但文档中的结果始终是 fi：print(fi)，所以我不确定如何。

Weka FPGrowth 输出：

python-3.x machine-learning pyspark apache-spark-mllib fpgrowth

2018-07-27T19:37:16.010

0 投票

1 回答

772 浏览

scala - Spark Scala FPGrowth 没有任何结果？

我正在尝试使用 Scala 从 Spark MLLib 中获取一些频繁的项目集和关联规则。但实际上我什么也没得到，甚至没有错误。可以在此处找到代码（spark/databricks 笔记本）和数据输入文件。

该算法要么没有找到任何频繁项集和/或关联规则，但有一些证据表明这是错误的。我对 KNIME（一个非编程分析平台）做了同样的事情，但使用 Borgelt 算法进行关联规则学习。在那里，我得到了带有升力和所有其他所需比率的前因、后因映射。但是在使用 Scala 的 Spark 中，我什么也得不到。

这段代码的输出是：

任何想法，将不胜感激。

scala apache-spark apache-spark-mllib databricks fpgrowth

2018-08-31T12:53:27.930

0 投票

0 回答

302 浏览

scala - Spark Scala：将 Row 的 RDD 转换为 Basket 的 RDD

我正在尝试运行 FPGrowth，但实际上我遇到了输入类型的问题。给定代码：

这会产生以下输出：

代码继续转换为 RDD 并执行 FPGrowth

然后 Spark 告诉我：

然后我试图映射数据框

但这会导致另一个问题：

如何将类型参数 (T) 推断为 getAs List 命令？

或者有没有人有另一个好主意如何实际解决需要一个篮子的 RDD 但有一个 RDD 的 Rows 的问题？

谢谢你们

scala apache-spark rdd fpgrowth

2018-09-07T12:44:25.350

0 投票

1 回答

91 浏览

mysql - 如何将 RapidMiner 中的关联规则存储到 MySQL 表中

我需要将 fp-growth 关联规则从 RapidMiner 导出到 MySQL 数据库。该表包含以下列：premises、conclusion和。supportconfidence

我应该使用哪个运算符？

mysql rapidminer fpgrowth

2018-09-29T12:08:44.087

1 2 3 4 5 6 7 8 9 10