1

我在 csv 中有一个带有分隔符的数据集,如下所示。

NO_CAND";"DS_CARGO";"CD_CARGO";"NR_CAND";"SG_UE";"NR_CNPJ";"NR_CNPJ_1";
CLODOALDO JOSÉ DE RAMOS";"Deputado Estadual";"7";"22111";"PB";"08126218000107";"Encargos financeiros e taxas bancárias";

我正在使用带有选项的函数 read.csv2

mydataframe <- read.csv2("filename.csv",header = T, sep=";", quote="\\'", dec=",",
stringsAsFactors=F,  check.names = F, fileEncoding="latin1")      

代码读入数据,但带有所有引号。

我试图使用删除引号

mydataframe[,] <- apply(mydataframe[,], c(1,2), function(x) { 
gsub("\\'", "", x)
})

但它不起作用。

关于如何导入数据以摆脱这些引号的任何想法?

非常感谢。

4

1 回答 1

1

要删除引号,请使用lapplygsub,如下所示。

mydataframe[] <- lapply(mydataframe, function(x) gsub("\"", "", x))

lapply遍历数据框的所有列并返回一个列表;通过mydataframe[]在分配的 LHS 上进行分配,您可以将结果分配回数据框中,而不会丢失其属性(尺寸、名称等)。此外,您的数据中没有任何单引号',因此搜索它们不会有任何效果。

于 2013-07-19T15:25:04.367 回答