1

我一直在使用交叉验证过程来训练朴素贝叶斯模型,并且我意识到它使用kFold方法来获取随机采样数据以创建折叠。这个方法返回一个Array[(RDD[T], RDD[T])]元组,我认为它是用于训练和测试的不同折叠组合的集合。

我的问题是是否有任何具体原因,因为 API 不允许您定义自己的折叠数组。我需要这个功能,我猜我必须编写自己的 CrossValidator 类才能支持该功能。我也愿意接受建议。

4

0 回答 0