0

我只是将文件输入 plink 时遇到问题(我对编码很陌生)。目前,我只是想在plink中制作一个床文件

我最近运行了一个 HD SNP Array 来寻找拷贝数变异。在我尝试将 ped 和 map 文件输入到 plink 之前,一切似乎都很好。最初,我收到“.ped 文件中缺少一半调用”的错误消息,但是当我检查文件行时,我看不到任何问题,即在错误消息中注明的位置,有一个 0/​​0。

经过多次尝试解决这个问题,我被建议尝试使用 vcf 格式的文件并将这些文件输入 plink。我现在收到一条不同的错误消息:

.vcf 文件第 533890 行的变体 bp 坐标无效

我在整个互联网上进行了搜索,但无法找到任何解决方案

这是我试图运行的代码行:

/data1/_software/plink/plink --vcf RBV_MNEc670_BPW_NoPQC.vcf --make-bed --out SNP_array_bed --horse --no-pheno --no-sex --no-parents --no-fid

我知道我想制作一个床文件,而且我很确定我没有犯任何语法错误。我当前的错误消息如下:

检测到 257665 MB RAM;为主工作区保留 128832 MB --vcf:533k 变体已完成。错误:.vcf 文件第 533890 行的变体 bp 坐标无效。

任何帮助将不胜感激!

4

2 回答 2

1

如果有人遇到类似的问题,我终于解决了我的问题。

出于某种原因,导出 vcf 文件产生了一个奇怪的问题,其中一些未调用的变体,而不是0/0拥有./..

例如:

0   AX-102948208    N   N   .   PASS    UNKNOWNPOSITION;CR=100;ConversionType=PolyHighResolution    GT  ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./. ./.

我仍然不知道为什么会这样,但是快速使用 grep 命令删除了这些变体,我成功地将文件输入到plink.

希望这可以帮助其他人摆脱困境。

于 2019-08-09T11:34:48.307 回答
0

我建议使用另一个选项--vcf-half-call <mode>来处理 Error: Half-missing call in .ped file at variant。

请在此链接中查看更多信息

于 2021-11-09T08:55:03.010 回答