0

摘要
我正在使用 Arule 包使用 RStudio 创建篮子分析规则。我将 WorkSpace 保存到一个文件(即x.RDATA)。并使用 VS.NET 中的 R.DOTNET Nuget PackAge 来查询规则。我正在调用 RFunction 发送参数。

到目前为止没有问题。但是....当我发送 ARule 函数中不存在的 ProductCode 时,它​​会引发错误。

lhs %ain% newBasket 中的错误:表包含未知项目标签

我使用数据集Groceries来重现场景。在我看来,该产品不可能出现在模型中。

它可能是新产品,也可能由于其低信心、支持提升而在规则中不存在

# Load the libraries
library(arules)
library(arulesViz)
library(datasets)

# Load the data set
data(Groceries)
# Get the rules
rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.8))
# Sorting 
rules<-sort(rules, by="confidence", decreasing=TRUE)

# Redundancies 
subset.matrix <- is.subset(rules, rules)
subset.matrix[lower.tri(subset.matrix, diag=T)] <- NA
redundant <- colSums(subset.matrix, na.rm=T) >= 1
rules.pruned <- rules[!redundant]
rules<-rules.pruned

#-----------------------------------------------------------------------------------
#FUNCTION
fn_findRules <- function(rules, newBasket){
  arules<-subset(rules, subset = lhs %ain% newBasket)
  arules.sorted <- sort(arules, by="lift")
  return (arules)
}
#-----------------------------------------------------------------------------------

当我用参数“热带水果”、“酸奶”调用函数时,没有问题。

#Calling Function For Test 
newBasketItems <- c("tropical fruit", "yogurt")
RuleResult <- fn_findRules(rules, newBasketItems)
inspect(RuleResult[1:5])

结果:

    lhs                                                                rhs                support   confidence lift  
264 {tropical fruit,grapes,whole milk,yogurt}                       => {other vegetables} 0.0010168 1.00000    5.1682
269 {ham,tropical fruit,pip fruit,yogurt}                           => {other vegetables} 0.0010168 1.00000    5.1682
276 {tropical fruit,root vegetables,yogurt,oil}                     => {whole milk}       0.0011185 1.00000    3.9136
395 {sausage,tropical fruit,root vegetables,yogurt}                 => {whole milk}       0.0015252 0.93750    3.6690
410 {citrus fruit,tropical fruit,root vegetables,whole milk,yogurt} => {other vegetables} 0.0014235 0.93333    4.8236

但是,如果我使用参数“ tropical NEW PRODUCT ”、“yogurt”调用该函数,则会引发错误。

#Calling Function
newBasketItems <- c("tropical NEW PRODUCT", "yoguurt")
RuleResult <- fn_findRules(rules, newBasketItems)

Error in lhs %ain% newBasket : table contains an unknown item label 

我该如何处理这个错误?

4

0 回答 0