非常新,所以让我知道这是否要求太多。我正在尝试将 R 中的面板数据分成两个不同的类别;一种具有完整的变量信息,另一种具有不完整的变量信息。我的数据如下所示:
Person Year Income Age Sex
1 2003 1500 15 1
1 2004 1700 16 1
1 2005 2000 17 1
2 2003 1400 25 0
2 2004 1900 26 0
2 2005 2000 27 0
我需要做的是遍历每一列(不是第 1 列和第 2 列),如果变量的数据已满(变量由第一列中的 id 和列名定义,上图中的示例是person1Income) 将其返回到数据集。否则将其放入不同的数据集中。这是我的元代码和给出上述数据的示例。注意:我通过变量的 id 名称然后列名称来调用变量,例如变量 person1Income 将是第三列中的前三行。
for(each variable in all columns except 1 and 2 in data set) if (variable = FULL) { return to data set "completes" }
else {put in data set "incompletes"}
completes = person1Income, person2Income, person1Age, person2Age, person1Sex, person2 sex
incompletes = {empty because the above info is full}
我理解如果有人不能完全回答这个问题,但任何帮助表示赞赏。另外,如果我的目标不明确,请告诉我,我会尽力澄清。
tl;博士我还不能用一句话来解释它所以......对不起。
编辑:我所说的完整和不完整变量的可视化。截屏