2

我可以在这里得到一些帮助吗?在从“ped”、“map”格式转换为二进制对应的“bed”、“bim”、“fam”时,是否有人在 plink(全基因组关联分析工具集)中遇到以下错误?我正在使用 Linux 和 plink v1.90b3j。

Error: Line 1 of .ped file has fewer tokens than expected.

我在 python 脚本中使用这个命令在几十个文件上运行它:

plink --file S205 --out S205 --make-bed

对于 32 个文件中的只有 2 个,在这种情况下,我收到此错误。该文件与所有其他文件完全相同,因为它们之前也都是使用相同的脚本完成的。所有样本的家庭、父亲、母亲 ID 和性别都相同,正如我所说,等位基因信息的写入方式与所有其他 30 个工作文件完全相同。

当我将行尾编码更改为“Windows”时,我注意到错误更改为以下内容。其他好的文件适用于任何类型的行尾(Unix、Win、Mac)。

Error: Line 4009 of .bim file has fewer tokens than expected.

作为一个例子,我在这里留下工作 *.ped (S209) 和非工作 (S204) 的第一和最后 X 列。

S209 S209 0 0 1 1 C C C C T T T T ... G G G G G G 

S204 S204 0 0 1 1 T T T T G G G G ... G G G G C C 

谢谢!丹尼尔

4

1 回答 1

1

我发现了问题。由于低质量的碱基,我的“ped”文件与“map”文件的基因型数量不完全相同。我的脚本跳过了这些 SNP,没有向“ped”输出任何内容。由于“地图”文件是根据 GATK 堆积文件位置创建的,因此存在不匹配,因为所有位置都转移到“地图”文件中。尽管将其留在这里可能很有用,但可以将其标记为已解决。

于 2019-04-12T12:15:55.690 回答