0

我有两组坐标:

  • 用 49,898 个 x 和 y 组合设置 A
  • 用 36,404 个 x 和 y 组合设置 B。
  • (A 组包含 B 组中的所有组合加上额外的 13,494 种组合)
  • Excel 或 R 中的解决方案都可以

我想提取这组独特的 13,494 个组合。为了尝试使用 Excel 或 R 提取这些唯一值,我已将 Set B 的 x & y 坐标组合复制到与 Set A 相同的列中。

表格布局是两列Xcod, Ycodx 和 y 示例

我已经阅读了许多建议使用 excel & R 的帖子,它们部分解决了这个问题,除了输出总是 49,898 个组合,因为它们保持了“原始”重复值集。我理解为什么会这样,但我想要完全删除这些重复项,以便我有一个包含 Set A 独特的 13,494 个组合的最终输出。

[Excel] 我使用了以下内容:Data -> Advanced Filter -> Unique records only

[R] 我使用了这个线程中的以下代码:

UniqRemDups <- unique(RemDups[,c('Xcod','Ycod')])

如何从 R 数据框中过滤列的唯一组合

任何帮助/建议将不胜感激。

4

1 回答 1

1

在 R 中使用来自 mgcv 的 uniquecombs 函数的一种方法。

data <- structure(list(Xcod = c(4405000L, 4415000L, 4425000L, 4435000L, 
4445000L, 4455000L, 4465000L, 4475000L, 4435000L, 4495000L, 4505000L, 
4515000L, 4525000L, 4535000L, 4545000L, 4555000L, 4565000L, 4575000L, 
4585000L), Ycod = c(4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L
)), .Names = c("Xcod", "Ycod"), class = "data.frame", row.names = c(NA, 
-19L))

library(mgcv)
unique_rows <- uniquecombs(data)
于 2017-03-14T19:39:05.097 回答