r - 对于两组坐标，提取 Set A 减去 Set B 的唯一行

Question

我有两组坐标：

用 49,898 个 x 和 y 组合设置 A
用 36,404 个 x 和 y 组合设置 B。
（A 组包含 B 组中的所有组合加上额外的 13,494 种组合）
Excel 或 R 中的解决方案都可以

我想提取这组独特的 13,494 个组合。为了尝试使用 Excel 或 R 提取这些唯一值，我已将 Set B 的 x & y 坐标组合复制到与 Set A 相同的列中。

表格布局是两列Xcod, Ycod：x 和 y 示例

我已经阅读了许多建议使用 excel & R 的帖子，它们部分解决了这个问题，除了输出总是 49,898 个组合，因为它们保持了“原始”重复值集。我理解为什么会这样，但我想要完全删除这些重复项，以便我有一个包含 Set A 独特的 13,494 个组合的最终输出。

[Excel] 我使用了以下内容：Data -> Advanced Filter -> Unique records only

[R] 我使用了这个线程中的以下代码：

UniqRemDups <- unique(RemDups[,c('Xcod','Ycod')])

如何从 R 数据框中过滤列的唯一组合

任何帮助/建议将不胜感激。

score 1 · Accepted Answer

在 R 中使用来自 mgcv 的 uniquecombs 函数的一种方法。

data <- structure(list(Xcod = c(4405000L, 4415000L, 4425000L, 4435000L, 
4445000L, 4455000L, 4465000L, 4475000L, 4435000L, 4495000L, 4505000L, 
4515000L, 4525000L, 4535000L, 4545000L, 4555000L, 4565000L, 4575000L, 
4585000L), Ycod = c(4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L
)), .Names = c("Xcod", "Ycod"), class = "data.frame", row.names = c(NA, 
-19L))

library(mgcv)
unique_rows <- uniquecombs(data)

r - 对于两组坐标，提取 Set A 减去 Set B 的唯一行

1 回答 1

Related

Reference