我有一个带有变量 VAR 的数据集 DATA。这个变量模式是数字的,它的类是一个因素。它代表性别。打印出来后,如下所示
VAR
M
M
F
U
M
当我打印出级别时,它输出:“”“F”“M”“U”,频率表如下所示:
F M U
2 30 25 1
我想要做的是将不是“F”或“M”的所有内容更改为缺失值,然后将它们标记为“Man”和“Woman”,并为变量删除未使用的级别(但仍然留下缺失的级别) . 到目前为止,我有以下代码:
DATA$VAR[DATA$VAR == "U" | DATA$VAR == ""] <- NA
但是我得到了完全相同的水平值,现在频率表如下所示:
F M U
0 30 25 0
我觉得我很接近,但并不完全在那里。我不明白如何处理水平问题。任何帮助是极大的赞赏。