1

我正在尝试从GWAS 目录中获取特定的疾病相关信息。这可以通过电子表格下载直接从网站上完成。但我想知道是否可以在 R 中以编程方式进行。任何建议将不胜感激。

谢谢。

阿沃克斯

4

2 回答 2

2

签出功能 download.file() 和包 rcurl (http://cran.r-project.org/web/packages/RCurl/index.html) - 这应该可以满足您的需求

于 2011-10-11T09:41:45.213 回答
0

您必须先下载.tsv文件并手动编辑它们。这是因为 GWAS 目录文件包含 HTML 符号,例如“Behçet's disease”中的§(定义特殊的第四个字母)。这些符号中的#将被 R 解释为行尾,因此您将收到一条错误消息,例如:

第 2028 行没有 34 个元素

因此,您首先下载它,在纯文本编辑器中打开,自动将每个#替换为空字符,然后才将其加载到 R 中:

read.table("gwas_catalog_v1.0-associations_e91_r2018-02-21.tsv",sep="\t",h=T,stringsAsFactors = F,quote="")
于 2018-02-25T01:11:26.777 回答