我已经实现了数据之间的关联。因此,在使用 TF-IDF 并计算数据之间的距离后,我有一个距离矩阵。我还生成了一个包含 50 个集群的凝聚层次聚类。现在我想预测顺序关联规则(即使文章不在同一个集群中)?有谁知道我可以使用哪种算法?
我所有的数据都按列排序,并且有一个前提条件的概念。例如,根据 1 的元素在(在时间上)根据 2 的元素之前。
这是我的数据:
分拣机 | 文章 | 买家 |
---|---|---|
1 | 苹果 | 客户1 客户2 客户4 |
2 | 大米 | 客户 2 客户 4 客户 5 |
3 | 意大利面 | 客户 2 客户 3 客户 6 |
... |
我的距离矩阵是每篇文章之间的距离,我的凝聚层次聚类是关于文章关联的。所以我想用置信度分数预测文章模式:Apples -> Rices Confident = 1 Apples, Rices -> Pastas Confident = 0.2