我正在寻找一种方法来检查数据框中的两列是否包含一个或多个行的相同元素,然后消除包含更多 NA 的行。
假设我们有一个这样的数据框:
x <- data.frame("Year" = c(2017,2017,2017,2018,2018),
"Country" = c("Sweden", "Sweden", "Norway", "Denmark", "Finland"),
"Sales" = c(15, 15, 18, 13, 12),
"Campaigns" = c(3, NA, 4, 1, 1),
"Employees" = c(15, 15, 12, 8, 9),
"Satisfaction" = c(0.8, NA, 0.9, 0.95, 0.87),
"Expenses" = c(NA, NA, 9000, 7500, 4300))
请注意,瑞典在 2017 年的条目有两次,但第一行有一个带有 NA 的条目,而另一行在三个位置包含 NA。现在我想检查两行是否包含相同的“年份”和“国家”,然后继续消除包含较高数量 NA 的行,在这种情况下是第二行。我做了一些研究,但似乎无法为这种特殊情况找到解决方案。
非常感谢您提前。