0

我有一个应该包含 14 列的数据集,但是当我将它读入 R 时,它显示为两列,后面的列读为一列,并且都用“。”分隔。

我阅读使用:

dat <- read.table ("/data/GER.female.RAWMACH", header = F, sep = "\t")

下面我提供了输出:

头(数据)

V1
特质
案例
案例
案例
案例
案例
案例

V2 MARKER........等位基因..FREQ1..RSQR...EFFECT1..OR......STDERR..​​WALDCHISQ.PVALUE......LRCHISQ.LRPVAL.NCASES .NCONTROLS
rs7 TA .9104 .0001 -3.944 0.019 19.634 0.0403 0.8408 0.0403 0.8409 260 446

rs6 交流 .9114 .0002 -2.552 0.078 14.349 0.0316 0.8589 0.0316 0.8589 260 446

rs9 CT .8444 .0001 2.772 15.985 15.076 0.0338 0.8541 0.0338 0.8542 260 446

rs5 GA .9164 .0001 -3.683 0.025 18.039 0.0417 0.8382 0.0417 0.8383 260 446

rs2 TC .5168 .0001 -2.466 0.085 10.811 0.0520 0.8195 0.0520 0.8196 260 446

rs1 TG .8229 .0002 -1.727 0.178 12.241 0.0199 0.8878 0.0199 0.8878 260 446

我尝试了一些事情(重写表格,colsplit)但没有成功。我错过了什么?

感谢您提出的任何建议!

4

2 回答 2

1

你以为你有一个制表符分隔的文件,但事实并非如此。你也有一个标题。sep="\t"只需通过删除and 设置来使用默认的空格分隔符header=TRUE

于 2012-03-09T17:52:22.760 回答
0

没有更多信息很难确定,但我非常有信心解决这个问题的最佳方法是首先正确加载表格。除非你正在加载的数据的实际结构是你得到的形式,否则你加载它是错误的;查看文档read.table和相关方法,特别是sepandheader参数。我猜这将解决您的数据导入问题,而无需事后清理。

于 2012-03-09T17:22:22.233 回答