我在 R 中有一个大数据框(570 行乘 200000 列)。对于那些熟悉 PLINK 的人,我正在尝试为 GWAS 分析创建一个 PED 文件。Plink 要求每个缺失的字符用零编码。非缺失值是“A”、“T”、“C”或“G”。
因此,例如,数据结构在数据框中看起来像这样。
COL1 COL2
PT1 A T
PT2 T T
PT3 A A
PT4 A T
PT5 0 0
PT6 A A
PT7 T A
PTn T T
当我在 Plink 中运行我的文件时,我得到一个错误。我回去检查我在 R 中的文件,发现零是“字符”类型。 在 R 的给定列中是否可以有两种不同的数据类型(数字和字符)? 我尝试将 0 设为数字类型并将字母保留为字符类型,但它不起作用。