0

我有以下数据集。结果变量为State,共有3种类型。变量和样本数据如下:

 No.    Var2    Var3    Var4    Var5    Var6    Var7           Var8   Var9    Var10  Var11  State
297 middle a    NA       NA     16  working fu $25000 or more   more    1        1     NA     P
299 middle a    NA       no     9   working fu  $25000 or more  sevrl   NA       1     0      N
300 middle a    no       NA     12  working fu  $25000 or more  every   4        1     0      P
301 foreign     NA       no     17  working fu  $25000 or more  never   NA       0     0      P
303 middle a    no       no     19  working fu  NA             every   1        0     NA     P
304 middle a    no       NA     17  retired     $25000 or more  every   2        1     0      P
305 foreign     no       no     17  working fu  $25000 or more  sevrl   1        1     NA     P
306 middle a    no       no     16  working fu  $25000 or more  once    1        1     NA     V

结果变量分为三类 P、N、V。

我必须通过使用这些数据来预测未知数据的状态。我已经将数据和 R 中的模型与一组进行了划分,并与另一组进行了检查。

在 R 中尝试了以下模型:

  library(caret)
  control <- trainControl(method="repeatedcv", number=10, repeats=3)
  xgbGrid <-  expand.grid(max_depth  = c(1, 3, 5, 9),nrounds = (7:14)*100,eta = 0.1)
  ModelXGB <- train(Happy ~ ., data=MerTrain3, method="xgbTree",   trControl = control , tuneGrid = xgbGrid)
  predXGB <- predict(ModelXGB , newdata=MerTest3, type="raw")

# This gave me accuracy of 0.700297177

我想提高准确性。请建议我使用 R 中的任何算法来提高这种多类数据的准确性。我尝试过简单的 svm、nnet,但准确度没有任何提高。还请解释需要对建议模型中的参数进行哪些微调。如果提供任何链接,我可以共享数据集。感谢期待。

4

0 回答 0