我想知道 WSO2 ML 是否实现了交叉验证和网格搜索以获得最佳模型选择。
1 回答
目前,(从 1.1.0 版开始)WSO2 机器学习器没有直接的超参数优化方法。正如您在问题中提到的,我们计划在即将发布的版本之一中包含随机搜索和网格搜索。为了跟踪这个过程的进度,我创建了一个公共 JIRA [1]。因此,当新功能准备就绪时,我将通过此 SO Question 通知您。
接下来,让我简要描述一下我们在 WSO2 机器学习服务器中使用的交叉验证过程。在 ML Server 的 ML Wizard 的第三步中,您可以设置训练数据分数(请参阅随附的屏幕截图)。
因此,假设您选择 0.7 个数据进行训练。然后,模型构建过程将使用 70% 的数据进行训练,其余数据集(即 30%)将用于交叉验证。您可能会认识到这是一种最基本的交叉验证方法,它并不特别适用于小型数据集。因此,在即将发布的版本中,我们计划在当前可用的交叉验证方法之外包括 K 折交叉验证 [2]。
Yandi,如果您需要有关此问题或与我们产品相关的任何内容的进一步帮助,请告诉我。
谢谢,
上普尔
[1] https://wso2.org/jira/browse/ML-313
[2] https://en.wikipedia.org/wiki/Cross-validation_(statistics)#k-fold_cross-validation