我有一个带有变量 VAR 的数据集 DATA。这个变量模式是数字的,它的类是一个因素。它代表性别。打印出来后,如下所示
 VAR
  M
  M
  F
  U
  M
当我打印出级别时,它输出:“”“F”“M”“U”,频率表如下所示:
     F     M     U
 2   30    25    1
我想要做的是将不是“F”或“M”的所有内容更改为缺失值,然后将它们标记为“Man”和“Woman”,并为变量删除未使用的级别(但仍然留下缺失的级别) . 到目前为止,我有以下代码:
DATA$VAR[DATA$VAR == "U" | DATA$VAR == ""] <- NA
但是我得到了完全相同的水平值,现在频率表如下所示:
     F     M     U
 0   30    25    0
我觉得我很接近,但并不完全在那里。我不明白如何处理水平问题。任何帮助是极大的赞赏。