我喜欢在 Rapidminer 中制作预测模型。为了更清楚地了解我的数据集:我具有以下属性:国家/地区 2014 年至 2019 年的年度变化率 2020 年的变化率按部门和公司规模细分指标(例如拥有网站的公司的百分比)
目的:我想通过以下属性预测拆分之间的差异:每个行业/规模每个国家每个指标
由于我有超过 10 个部门/规模、30 多个国家和 20 多个指标,因此手动拆分是一项艰巨的工作,因为我需要为每个组合都这样做。我想知道 RapidMiner 中是否存在允许根据我上面列出的拆分属性进行预测的解决方案?最终目的是如果我能预测像 COVID-19 这样的大流行再次发生时会发生什么。
为了更好地理解,这就是我的 Rapidminer 设计视图现在的样子,试图将我的数据分成 70% 的训练和 30% 的测试并运行决策树模型。但是,正如您在下面看到的那样,这并不顺利。