database - Apriori 算法的数据集

Question

我打算为 Market Basket Analysis 开发一个应用程序（使用 apriori 算法），我发现了一个包含 90,000 多条交易记录的数据集。

问题是这个数据集没有项目的名称，只包含项目的条形码。

我刚刚开始项目并研究先验算法，有人可以帮我解决这个案例，使用以下数据集实现该算法的最佳方法是什么？

score 1 · Accepted Answer

这些数据集被认为是关键信息，连锁店不会为您提供这些信息，但您可以使用 SQL Server 自己生成一些示例数据集。

score 1 · Accepted Answer

1

该算法不需要项目的名称。

于 2012-03-28T13:41:26.597 回答

score 1 · Accepted Answer

该算法的定义独立于用于对象的标识符。此外，您没有发布“以下数据集”：P 如果您的问题是算法期望您的项目编号为 0、1、2，...那么只需扫描您的数据集并将每个单独的条形码映射到数字。

3 回答 3