所以我有一个非常大的数据集,我试图在 R 中查看它,其中大多数列中都有单词。
我想将这些字符数据转换为可以进行计算的有意义的值。
所以我为数值数据子值,例如:
mydataset<-sub("Least Concern",1, mydataset)
所有数字都在 1-7 之间。
然后我检查了我的所有子值是否符合我的预期,并且它们确实如此。
然后我将其转换为数据框,然后像这样转换每一列:
asnumbers["currentstatus"]<-(as.numeric(asnumbers$currentstatus))
但是当我查看时mydataset
,数字不是应有的数字,它们已经改变了 1 或 2。而且我看不到一致性,就像有时 1 会变成 2 有时不会。我很困惑。
有什么建议么?