r - 按ID合并了两个数据集，现在观察多了

翻译自：https://stackoverflow.com/questions/61809750 2020-05-15T00:36:27.940

37 次

R社区。因此，我将 csv“clin”与 csv“cpath”合并，以创建我的数据框“mint”。临床是 265 obs。62 个变量。cpath 是 64 个变量中的 169 个。薄荷是 270 的 2 个变量

我通过“kitid”变量（7位数字）合并了csv文件；因此，每个数据行都应该包含特定 kitid 的 clin 和 cpath 信息。（对于 cpath，kitid 被命名为“kitid2”，对于 clin 被命名为“kitid”，以帮助合并功能）

我在每个 csv 和“mint”数据框中搜索 kitid 中的重复项，但没有。

我确实注意到，在比较 mint$kitid 和 mint$kitid2 列时，“mint”数据框中只有一行具有 cpath 的 kitid，但没有 clin。这可以解释有 266 个观测值而不是 265 个观测值，但仍有 4 个数据行没有解释。

有谁知道额外的 4 个数据行可能来自什么？什么可能导致这种情况？

请帮忙！谢谢你们！

0 回答 0