我正在 Scala 中构建决策树系统,但我的数据中的某些条目具有相同的属性。我通过实现“随机”节点类型解决了这个问题,允许查询随机选择要遍历的分支,但是在尝试随机拆分其余示例时出现“MatchError”。我当前的代码:
def splitRandom(examples: Array[String]): Array[String]={
examples.collect {case x if(r.nextInt(100) < 50) => x}
}
“examples”是一个字符串数组,每个字符串是一行,包含一个数据条目及其所有属性。