我有一个数据文件(100 万行),其中有一个结果变量作为状态(是/否),具有三个连续变量和 5 个名义变量(每个变量中有 5 个类别)我想预测结果,即状态。我想知道哪种类型的分析有利于建立模型。我见过logit,probit,逻辑回归。我对从什么开始和分析更有可能对分析有用的变量感到困惑。
数据文件:性别、地区、年龄、公司、专业、工作、诊断、实验室、订单、状态
M,west,41,PA,FPC, Assistant,code18,27,3,yes
M,Southwest,65,CV,FPC,Worker,code18,69,11,no
M,South,27,DV,IMC,Assistant,无效,62,13,no
M,Southwest,18,CV,IMC,Worker,code8,6,1,yes
PS:使用R语言。任何帮助将不胜感激谢谢!