问题标签 [apriori]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 先验算法
我之前多次听说过 Apriori 算法,但从来没有时间或机会深入研究它,谁能简单地向我解释一下这个算法的工作原理?另外,一个基本的例子会让我更容易理解。
algorithm - 使用先验算法进行推荐
所以最近的一个问题让我意识到了相当酷的先验算法。我可以看到它为什么起作用,但我不确定的是实际用途。据推测,计算相关项目集的主要原因是能够根据某人自己的购买(或拥有的项目等)为他们提供推荐。但是你如何从一组相关的项目集到单独的推荐呢?
维基百科文章完成:
第二个问题是从那些具有最小置信度约束的大型项目集中生成关联规则。假设其中一个大项集是Lk,Lk = {I1, I2, ... , Ik},与这个项集的关联规则是这样生成的:第一条规则是{I1, I2, ... , Ik-1}⇒ { Ik},通过检查置信度,可以确定这条规则是否有趣。然后通过删除前件中的最后一项并将其插入到后件中来生成其他规则,进一步检查新规则的置信度以确定它们的兴趣度。这些过程迭代直到前件变为空
不过,我也不确定关联规则集如何帮助确定最佳建议集。也许我错过了这一点,并且 apriori 不适合这种用途?在这种情况下,它的用途是什么?
algorithm - 对 Apriori 的最低置信度和最低支持度
Apriori 算法的最小置信度和最小支持值的合适值是多少?你怎么能调整它们?它们是固定值,还是在算法运行期间发生变化?如果你以前用过这个算法,你用了什么值?
apriori - 有什么方法可以优化数据挖掘的 Apriori 算法?
我正在挖掘一些数据。我想节省时间。那么有什么方法吗?
sql - 使用 SQL 查询进行数据挖掘操作(模糊 Apriori 算法) - 使用 SQL 编码
所以我有这张表:
还有两个空白表:
我需要为每个事务中出现的每个项目找到 FUZZY 值:
例如,我使用最低支持 10% -> 0.1
我需要删除 I5、I6、I8,因为它的值 < 0.1 =>修剪步骤
然后存储:
2 组合
注意:这是最可能需要使用重复或递归之后的基本第一步,因为该过程将继续进行,直到不可能有其他项目组合,
然后从剩下的内容中我需要找到 K+1 项目集(这是 2 个组合itemset) =>加入步骤
然后执行另一个修剪步骤,删除小于 0.1 的值 {I3,I4}
3 组合
之后做另一个JOIN STEP组合通过修剪的项目集
执行另一个修剪步骤,删除小于 0.1 的值,即 {I1,I3,I4}
4 组合
通过剪枝K+4的组合项集(4个组合)
**因为没有包含此项目的交易
进程停止后,因为没有可能的组合
此时,ITEMSET 数据库有:
我如何在sql中编码?非常感谢!
注意:您可以根据需要添加另一个表。
machine-learning - Apriori算法实现
我正在使用 apiori 算法实现从事务集中生成关联规则,并且得到以下关联规则。但是我得到一个关联规则 1->8 我可以假设 8->1 因为看到关联规则它从 0 开始到 9 结束,因为有 10 个产品类别,但是使用这个算法我没有得到类似 8-> 2 或 9->1,所以我可以将关联规则 2->8 反转为 8->2。如果没有,有人可以指出更好的 apiori 算法实现
mysql - 是否可以在 mysql 语句中运行先验关联规则?
数据库:
在上表中,是否可以在 mysql 语句中运行先验关联规则?
比如buys(T, butter)的支持-->buys(T, jam) = 50%
因为有 4 笔交易并且 T1、T4 满足“支持”规则。
我可以只使用一条sql语句来找出这样的结果吗?
apriori - Apriori 算法 - 选择交易列表
我正在尝试使用先验算法推断客户帐户上发生的错误。所以我有一个像这样的错误表:
...
我想确定给定 M015 会出现什么错误。
(例如 M015 -> ??)
问题是错误表包含数十万行项目,并且有数百个可能的错误代码。那么我是否以非常低的信心运行我的算法以获取尽可能多的规则?或者我是否将错误数据库缩小到仅包含包含我感兴趣的错误的“事务”?
(例如,在这个例子中,如果我正在寻找规则 M015,我是否应该将事务表限制为只有 cust_id 100 和 102 的行项目?)
c# - 如何在 T-SQL 语句中找到 Apriori 关联?
数据库:
在上表中,如何用 T-SQL 语句找到这个结果?
测试表:
提前致谢。
c# - Apriori算法解释
我在 Internet 上找到了 Apriori 算法的实现,但其中有些我无法理解。我希望有人能帮助我。
现在我知道了 Apriori Gen 过程,我们通过将项集连接在一起来将它们变成更大的项集。但我看不出这是如何在前面的代码中实现的。为什么我们使用 temp?isExists 和 isContained 如何帮助我们?这两部分代码到底发生了什么?