4

我在网上搜索了很多,但没有找到任何有用的描述 R 中 C5.0 函数的“成本”参数。从 C5.0 R 手册中,它只是说“与可能的错误。矩阵应该有 C 列和行,其中 C 是类级别的数量”。它没有告诉我是模型的预测结果。

任何人都可以帮忙吗?

4

1 回答 1

8

这是来自 C5.0(版本 0.1.0-15)帮助页面的引用:

成本矩阵应该是 CxC,其中 C 是类的数量。对角线元素被忽略。列应该对应于真实的类,行是预测的类。例如,如果 C = 3,类别为红色、蓝色和绿色(按此顺序),则矩阵的 (2,3) 元素中的值 5 表示将绿色样本预测为蓝色的成本是五倍通常的值(一)。

按照帮助页面中的示例,这将是一个成本矩阵:

cost.matrix <- matrix(c(
  NA, 2, 4,
  3, NA, 5,
  7, 1, NA

), 3, 3, byrow=TRUE)

rownames(cost.matrix) <- colnames(cost.matrix) <- c("Red", "Blue", "Green")

cost.matrix

      Red Blue Green
Red    NA    2     4
Blue    3   NA     5
Green   7    1    NA

这将意味着以下内容:

  • 将红色样本预测为蓝色是通常值的 3 倍(一)
  • 将红色样本预测为绿色是通常值的 7 倍
  • 将蓝色样本预测为红色是常用值的 2 倍
  • 将蓝色样本预测为绿色是常用值的 1 倍
  • 将绿色样本预测为红色是常用值的 4 倍
  • 将绿色样本预测为蓝色是通常值的 5 倍
于 2013-11-14T08:36:20.857 回答