-1

我正在使用 Oracle 数据挖掘器 在我的工作流程中,我加入了两个表。一个销售表和一个产品表连接在产品密钥上。以下是我的ar分析中的以下细节:

Transaction id's - 单号 id, location sold id Item Id - 产品密钥 Value - 类名

以下工作正常,只是类名仍然过于笼统,无法获得有关产品的有意义信息。

如果我执行以下操作:

Transaction id's - slip number id, location sold id Item Id - 产品密钥 Value - 样式名称(产品表的一部分)

我得到的错误信息是:项目值样式名称有太多不同的值。允许的最大不同值数为 10

如何增加不同值的最大数量(无限会很棒,因为有些表有 100 的数百万条记录)。

我真的不明白为什么必须有这个限制。有人可以向我解释吗?

我正在使用 sql developer 3.2.20.09 和 Advanced Analytics 版本 11.2.0.3.0

提前致谢!

4

1 回答 1

0

您可能使用了太多数据。

不要数值数据(例如项目值)输入关联规则挖掘。

关联规则挖掘应该找到诸如

buys diapers  ->  also buys beer

对于这些算法,您需要只包含产品类别的记录,没有别的。对于这个(都市神话)玩具示例,您通常甚至不想知道哪个品牌的尿布或啤酒。即你希望你的输入数据是这样的:

diapers baby-food spaghetti tomatos
diapers beer
diapers baby-food beer
spaghetti tomatos cheese

其中每一行包含在一次交易中一起购买的产品类别。

然后对关联规则进行后期处理,例如检查他们贡献了多少价值,或者是否存在仅适用于特定品牌(即,当他们被送到超市购买尿布时,他们会更喜欢最便宜的啤酒还是优质啤酒)

如果没有对产品类别的抽象,您的结果可能不会很重要(即您将找不到任何东西)。

于 2013-05-25T12:24:51.177 回答