Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我一直在使用交叉验证过程来训练朴素贝叶斯模型,并且我意识到它使用kFold方法来获取随机采样数据以创建折叠。这个方法返回一个Array[(RDD[T], RDD[T])]元组,我认为它是用于训练和测试的不同折叠组合的集合。
Array[(RDD[T], RDD[T])]
我的问题是是否有任何具体原因,因为 API 不允许您定义自己的折叠数组。我需要这个功能,我猜我必须编写自己的 CrossValidator 类才能支持该功能。我也愿意接受建议。