我有一些数据,我正在尝试将其加载到R中。它位于 .csv 文件中,我可以在 Excel 和 OpenOffice 中查看数据。(如果您好奇,这里是来自加拿大选举局数据的 2011 年民意调查结果数据)。
数据以不寻常的方式编码。一个典型的线路是:
12002,Central Nova","Nova-Centre"," 1","River John",N,N,"",1,299,"Chisholm","","Matthew","Green Party","Parti Vert",N,N,11
Central-Nova 的末尾有一个"
,但开头没有。因此,为了读取数据,我取消了引号,这对于前几个文件效果很好。IE。
test<-read.csv("pollresults_resultatsbureau11001.csv",header = TRUE,sep=",",fileEncoding="latin1",as.is=TRUE,quote="")
现在问题来了:在另一个文件中(例如 pollresults_resultatsbureau12002.csv),有这样一行数据:
12002,Central Nova","Nova-Centre"," 6-1","Pictou, Subd. A",N,N,"",0,168,"Parker","","David K.","NDP-New Democratic Party","NPD-Nouveau Parti democratique",N,N,28
因为我需要取消引号,所以该条目"Pictou, Subd. A"
使R想要将其拆分为 2 个变量。无法读取数据,因为它想在构建数据框的中途添加一列。
Excel 和 OpenOffice 都可以打开这些文件没有问题。不知何故,Excel 和 OpenOffice 知道引号只有在变量条目的开头才有意义。
你知道我需要在R上启用什么选项来获取这些数据吗?我有超过 300 个文件需要加载(每个文件大约有 1000 行),因此不能选择手动修复...
我到处寻找解决方案,但找不到。