我在网上搜索了很多,但没有找到任何有用的描述 R 中 C5.0 函数的“成本”参数。从 C5.0 R 手册中,它只是说“与可能的错误。矩阵应该有 C 列和行,其中 C 是类级别的数量”。它没有告诉我行或列是模型的预测结果。
任何人都可以帮忙吗?
我在网上搜索了很多,但没有找到任何有用的描述 R 中 C5.0 函数的“成本”参数。从 C5.0 R 手册中,它只是说“与可能的错误。矩阵应该有 C 列和行,其中 C 是类级别的数量”。它没有告诉我行或列是模型的预测结果。
任何人都可以帮忙吗?
这是来自 C5.0(版本 0.1.0-15)帮助页面的引用:
成本矩阵应该是 CxC,其中 C 是类的数量。对角线元素被忽略。列应该对应于真实的类,行是预测的类。例如,如果 C = 3,类别为红色、蓝色和绿色(按此顺序),则矩阵的 (2,3) 元素中的值 5 表示将绿色样本预测为蓝色的成本是五倍通常的值(一)。
按照帮助页面中的示例,这将是一个成本矩阵:
cost.matrix <- matrix(c(
NA, 2, 4,
3, NA, 5,
7, 1, NA
), 3, 3, byrow=TRUE)
rownames(cost.matrix) <- colnames(cost.matrix) <- c("Red", "Blue", "Green")
cost.matrix
Red Blue Green
Red NA 2 4
Blue 3 NA 5
Green 7 1 NA
这将意味着以下内容: