R社区。因此,我将 csv“clin”与 csv“cpath”合并,以创建我的数据框“mint”。临床是 265 obs。62 个变量。cpath 是 64 个变量中的 169 个。薄荷是 270 的 2 个变量
我通过“kitid”变量(7位数字)合并了csv文件;因此,每个数据行都应该包含特定 kitid 的 clin 和 cpath 信息。(对于 cpath,kitid 被命名为“kitid2”,对于 clin 被命名为“kitid”,以帮助合并功能)
我在每个 csv 和“mint”数据框中搜索 kitid 中的重复项,但没有。
我确实注意到,在比较 mint$kitid 和 mint$kitid2 列时,“mint”数据框中只有一行具有 cpath 的 kitid,但没有 clin。这可以解释有 266 个观测值而不是 265 个观测值,但仍有 4 个数据行没有解释。
有谁知道额外的 4 个数据行可能来自什么?什么可能导致这种情况?
请帮忙!谢谢你们!