15

我在一个名为“data.txt”的文件中有以下数据:

pid      1     2     4     15      18       20
1_at   100   200   89    189     299      788
2_at     8    78   33     89      90       99
3_xt   300    45   53    234      89       34
4_dx    49    34   88      8       9       15

数据由制表符分隔。

现在我想提取该表上的一些列,基于名为“vector.csv”的 csv 文件的信息,该向量得到以下数据:

18,1,4,20

所以我想以一个修改后的文件“datamod.txt”结束,该文件用以下选项卡分隔:

pid      18       1     4      20
1_at   299     100    89     788
2_at    90       8    33      99
3_xt    89     300    53      34
4_dx     9      49    88      15

在一些帮助下,我制作了以下代码:

fileName="vector.csv"
con=file(fileName,open="r")
controlfile<-readLines(con)
controls<-controlfile[1]
controlins<-controlfile[2]
test<-paste("pid",controlins,sep=",")
test2<-c(strsplit(test,","))
test3<-c(do.call("rbind",test2)) 
df<-read.table("data.txt",header=T,check.names=F)
CC <- sapply(df, class)
CC[!names(CC) %in% test3] <- "NULL"
df <- read.table("data.txt", header=T, colClasses=CC,check.names=F)
df<-df[,test3]
write.table(df,"datamod.txt",row.names=FALSE,sep="\t")

我遇到的问题是我生成的文件具有以下格式:

"pid"      "18"       "1"     "4"      "20"
"1_at"   299         100      89       788
"2_at"    90           8      33        99
"3_xt"    89         300      53        34
"4_dx"     9          49      88        15

我的问题是如何避免出现在我保存的文件中的那些引号“”标记,以便数据看起来像我想要的那样。

有什么帮助吗?

谢谢

4

1 回答 1

53

从帮助文件中引用write.table

quote

逻辑值(TRUE 或 FALSE)或数值向量。如果为 TRUE,任何字符或因子列都将被双引号括起来。如果是数字向量,则将其元素作为要引用的列的索引。在这两种情况下,行名和列名都会被引用,如果它们被写入的话。如果为 FALSE,则不引用任何内容。

所以

write.table(df,"datamod.txt",row.names=FALSE,sep="\t", quote = FALSE)

应该工作得很好。

于 2013-02-13T04:59:12.947 回答