我有 1000 G PLINK 格式的数据集,有一些名称为"."
的 snps,在 PLINK 中有什么方法可以删除该 snps?
我尝试了无法正常工作的 bcftool 视图。
执行以下命令
plink --bfile $YOUR_GENOTYPE_FILE --extract SNPS_TO_EXCLUDE.txt --make-bed --out $NEW_GENOTYPE_FILE
其中$
变量是您想要的 PLINK BED/BIM/BAM 文件前缀。
SNPS_TO_EXCLUDE.txt
看起来像什么?来自PLINK 网站:
--extract
通常接受带有变体 ID 列表的文本文件(通常每行一个,但它们可以只用空格分隔),并从当前分析中删除所有未列出的变体。
--exclude
对所有列出的变体执行相同的操作。
因此,SNPS_TO_EXCLUDE.txt
应该包含一个带有“ .
”的行。