我正在使用数据集“成人”。 http://archive.ics.uci.edu/ml/datasets/Adult 我已经使用 apriori 检索了频繁的规则并通过提升对其进行排序。
library(arules)
trans = read.transactions("adult.data", format = "basket", sep = ",", rm.duplicates = TRUE)
rules <- apriori(trans)
rules.lift <- sort(rules, decreasing = TRUE, by="lift")
当我执行
inspect(head(rules.lift,100))
我获得以下内容:
lhs rhs support confidence lift
1 { 13,
Male,
United-States} => { Bachelors} 0.1024507 0.9976077 6.066125
2 { 0,
13,
Male,
United-States} => { Bachelors} 0.1024507 0.9976077 6.066125
ETC
例如,在规则中:
{ 0,
13,
Male,
United-States} => { Bachelors}
我怎么知道那个0
和那个13
是哪个属性?我已经查看了数据集的描述和数据本身,所以我猜这13
是教育数字和0
资本损失,但有时两个或多个属性可以具有相同的范围,所以我不知道如何区分它们.
>class(rules.lift)
[1] "rules"
attr(,"package")
[1] "arules"
我在这里读过:我们怎么知道规则中生成的项目的列名/属性,问题是我没有预处理数据。那么,我该怎么做呢?
非常感谢!