我有以下数据集。结果变量为State,共有3种类型。变量和样本数据如下:
No. Var2 Var3 Var4 Var5 Var6 Var7 Var8 Var9 Var10 Var11 State
297 middle a NA NA 16 working fu $25000 or more more 1 1 NA P
299 middle a NA no 9 working fu $25000 or more sevrl NA 1 0 N
300 middle a no NA 12 working fu $25000 or more every 4 1 0 P
301 foreign NA no 17 working fu $25000 or more never NA 0 0 P
303 middle a no no 19 working fu NA every 1 0 NA P
304 middle a no NA 17 retired $25000 or more every 2 1 0 P
305 foreign no no 17 working fu $25000 or more sevrl 1 1 NA P
306 middle a no no 16 working fu $25000 or more once 1 1 NA V
结果变量分为三类 P、N、V。
我必须通过使用这些数据来预测未知数据的状态。我已经将数据和 R 中的模型与一组进行了划分,并与另一组进行了检查。
在 R 中尝试了以下模型:
library(caret)
control <- trainControl(method="repeatedcv", number=10, repeats=3)
xgbGrid <- expand.grid(max_depth = c(1, 3, 5, 9),nrounds = (7:14)*100,eta = 0.1)
ModelXGB <- train(Happy ~ ., data=MerTrain3, method="xgbTree", trControl = control , tuneGrid = xgbGrid)
predXGB <- predict(ModelXGB , newdata=MerTest3, type="raw")
# This gave me accuracy of 0.700297177
我想提高准确性。请建议我使用 R 中的任何算法来提高这种多类数据的准确性。我尝试过简单的 svm、nnet,但准确度没有任何提高。还请解释需要对建议模型中的参数进行哪些微调。如果提供任何链接,我可以共享数据集。感谢期待。