我想使用 Apriori 对交易数据进行亲和力分析。我有一张包含订单列表及其信息的表格。我主要需要使用 OrderID 和 ProductID 属性,格式如下
OrderID 产品ID
1 A
1 B
1 C
2 A
2 C
3 A
Weka 要求您为每个产品 ID 创建一个名义属性,并使用如下所示的 true 或 false 值指定该项目是否存在于订单中:
1,真,真,真
2,真,假,真
3,真,假,假
我的数据集包含大约 10k 条记录……大约 3k 种不同的产品。谁能建议一种以这种格式创建数据集的方法?(除了手动耗时的方式......)