2

我在 PLINK 中执行了 GWAS,现在我想在一个名为snps.txt.

我想将这些特定 SNP 的 PLINK 数据导出到一个.txt.csv文件中。理想情况下,该文件将包含这些 SNP 的单个 ID 和基因型,以便我以后可以将其与我的表型文件合并并执行其他分析和绘图。

有没有简单的方法可以做到这一点?我知道我只能--extract用来请求特定的 SNP,但我找不到告诉 PLINK 将数据导出为“可导出”基于文本的格式的方法。

4

1 回答 1

5

如果您使用的是经典 plink (1.07),您应该考虑升级到plink 1.9。它速度更快,并且支持更多格式。这个答案适用于 plink 1.9。

将二进制 plink 数据转换为 .csv 文件

听起来您的问题是您无法将二进制数据转换为常规的 plink 文本文件。

使用重新编码选项很容易做到这一点。应该使用它不带任何参数来转换为 plink 文本格式:

plink --bfile gwas_file --recode --extract snps.txt --out gwas_file_text

如果您想在之后将 .ped 数据转换为 csv,您可以执行以下操作:

cut -d " " -f2-2,7- --output-delimiter=, gwas_file_text.ped

这将生成一个以逗号分隔的文件,第一列中包含 ID,然后是基因型。

将 plink 数据转换为其他基于文本的文件格式

请注意,您还可以将数据转换为许多其他基于文本的文件类型,所有这些都在文档中进行了描述。

其中之一是通用变体调用格式 (VCF),它根据要求在一个文件中创建一个包含 snps 和单个 ID 的文件:

plink --bfile gwas_file --recode vcf --extract snps.txt --out gwas_file_text
于 2014-05-23T06:45:57.710 回答