-1

我有一些个人数据集。所以我把它分成变量来预测和预测。以下是语法:

library(Cubist)
str(A)
'data.frame':   6038 obs. of  3 variables:
 $ ads_return_count : num  7 10 10 4 10 10 10 10 10 9 ...
 $ actual_cpc       : num  0.0678 0.3888 0.2947 0.0179 0.095 ...
 $ is_user_agent_bot: Factor w/ 1 level "False": 1 1 1 1 1 1 1 1 1 1 ...
cubist(A[,c("ads_return_count","is_user_agent_bot")],A[,"actual_cpc"])

我收到以下错误

cubist code called exit with value 1
Error in strsplit(tmp, "\"")[[1]] : subscript out of bounds

有什么我想念的吗?

4

2 回答 2

1

模拟一些数据以制作可重现的示例:

A=data.frame(ads_return_count=sample(100,10,TRUE), actual_cpc=runif(100), is_user_agent_bot=factor(rep("False",100)))

cubist(A[,c("ads_return_count","is_user_agent_bot")],A[,"actual_cpc"])
cubist code called exit with value 1
Error in strsplit(tmp, "\"")[[1]] : subscript out of bounds

太好了,现在我们在同一页上。

令我困扰的是,第二个论点,即结果,全是“假”。我不确定只有一个结果的模型是否有意义。让我们尝试一下有两个结果:

> A2=data.frame(ads_return_count=sample(100,10,TRUE), actual_cpc=runif(100), is_user_agent_bot=sample(c("True","False"),100,TRUE))
> cubist(A2[,c("ads_return_count","is_user_agent_bot")],A2[,"actual_cpc"])

Call:
cubist.default(x = A2[, c("ads_return_count", "is_user_agent_bot")], y =
 A2[, "actual_cpc"])

Number of samples: 100 
Number of predictors: 2 

Number of committees: 1 
Number of rules: 1 

cubist我会说这是由单一结果可能性引起的不具信息性的错误消息。

于 2015-06-23T13:45:32.753 回答
0

我的问题与我的相同,但结果是关卡名称是缺失值“”。用文本替换这些级别就可以了。

似乎与 c5.0 决策树 C5.0 决策树有类似的问题 - c50 代码称为退出,值为 1

于 2020-02-11T17:55:16.867 回答