我有一个包含许多缺失值的 .csv 数据集,我希望 R 在读取表格时以相同的方式(“正确”方式)识别它们。我一直在使用:
import = read.csv("/Users/dataset.csv",
header =T, na.strings=c(""))
这个脚本用一些东西填充所有的空单元格,但它并不一致。当我用 来查看数据时head(import)
,一些缺失的单元格被填充,<NA>
一些缺失的单元格被填充NA
。我担心 R 在开始分析数据集时会以不同的方式处理这两种识别缺失值的方法,因此我希望导入统一读取这些缺失值。
最后,我的 csv 文件中的一些缺失值仅用句点表示。当我导入到 R 时,我还希望这些句点由正确的缺失值表示法表示。