我可以在这里得到一些帮助吗?在从“ped”、“map”格式转换为二进制对应的“bed”、“bim”、“fam”时,是否有人在 plink(全基因组关联分析工具集)中遇到以下错误?我正在使用 Linux 和 plink v1.90b3j。
Error: Line 1 of .ped file has fewer tokens than expected.
我在 python 脚本中使用这个命令在几十个文件上运行它:
plink --file S205 --out S205 --make-bed
对于 32 个文件中的只有 2 个,在这种情况下,我收到此错误。该文件与所有其他文件完全相同,因为它们之前也都是使用相同的脚本完成的。所有样本的家庭、父亲、母亲 ID 和性别都相同,正如我所说,等位基因信息的写入方式与所有其他 30 个工作文件完全相同。
当我将行尾编码更改为“Windows”时,我注意到错误更改为以下内容。其他好的文件适用于任何类型的行尾(Unix、Win、Mac)。
Error: Line 4009 of .bim file has fewer tokens than expected.
作为一个例子,我在这里留下工作 *.ped (S209) 和非工作 (S204) 的第一和最后 X 列。
S209 S209 0 0 1 1 C C C C T T T T ... G G G G G G
S204 S204 0 0 1 1 T T T T G G G G ... G G G G C C
谢谢!丹尼尔