r - 是否有模仿 ArcGIS 10.1 中的分组分析工具的 R 函数？

Question

我是 R 的初学者，但是使用 Esri 的 ArcGIS 的专家。

我想在这里使用 R 来运行探索性分组/聚类分析，例如 Arc 的 10.1 工具。

所需的最终产品必须是地图可视化。我在 SO上找到了关于层次聚类分析的这个线程。这与 Esri 的数据分组分析类型相同吗？ArcGIS 工具在参数方面提供了很大的灵活性，我希望用 R 复制这个功能。

同样，我是 R 初学者。非常感谢任何信息、建议或建议。

谢谢，迈克

score 3 · Accepted Answer

据我所知，这是一个简单的 KNN 分析。ESRI 帮助解释的替代“无距离矩阵”组件似乎非常不可取。基本上，他们使用 K-means 聚类和使用随机播种的区域增长方法。这似乎非常不稳定，并且可能返回高度可变的结果。似乎他们正在执行一些操作来避免诸如断开区域之类的问题，因此可能需要做一些事情才能准确地重新创建他们的结果。您可以近似 spdep 中的“空间受限”选项。这是一个距离分析的简短示例，它将为您提供一个起点。请记住，为了分配“类”，您需要设置某种类型的循环结构。

require(sp)
require(spdep)

data(meuse) 
coordinates(meuse) <- ~x+y

# Create distance matrix of specified range
meuse.dist <- dnearneigh(coordinates(meuse), 0.0001, 1000)

# Coerce distance object to a list object with distances for each observation
dist.list <- nbdists(meuse.dist, coordinates(meuse))

# Create a new column with the distance to the nearest observation using lapply and unlist
meuse@data <- data.frame(meuse@data, NNDist=unlist(lapply(dist.list, FUN=function(x) min(x))))

# Plot results
spplot(meuse, "NNDist", col.regions=colorRampPalette(c("blue","yellow","red"),
       interpolate="spline")(10)  )

您可能还想探索层次聚类。然而，对于较大的数据集，hclust 需要一个三角距离矩阵，而 dnearneigh 不需要。这是一个使用约束层次聚类的例子。

# SPATIALLY CONSTRAINED CLUSTERING
require(sp)
require(rioja)

data(meuse)
  coordinates(meuse) <- ~x+y
    cdat <- data.frame(x=coordinates(meuse)[,1],y=coordinates(meuse)[,2])
      rownames(cdat) <- rownames(meuse@data)

chc <- chclust(dist(cdat), method="conslink")

# KNN
  chc.n3 <- cutree(chc, k=3) 

# DISTANCE  
  chc.d200 <- cutree(chc, h=200) 

meuse@data <- data.frame(meuse@data, KNN=as.factor(chc.n3), DClust=chc.d200)

opar <- par
  par(mfcol=c(1,2))  
   cols <- topo.colors(length(unique(meuse@data$KNN)))  
    color <- rep("xx", nrow(meuse@data))
      for(i in 1:length(unique(meuse@data$KNN))) {
        v <- unique(meuse@data$KNN)[i] 
          color[(meuse@data$KNN == v)] <- cols[i]
        }
    plot(meuse, col=color, pch=19, main="KNN Clustering")

    cols <- topo.colors(length(unique(meuse@data$DClust)))  
    color <- rep("xx", nrow(meuse@data))
      for(i in 1:length(unique(meuse@data$DClust))) {
        v <- unique(meuse@data$DClust)[i] 
          color[(meuse@data$DClust == v)] <- cols[i]
        }
    plot(meuse, col=color, pch=19, main="Distance Clustering")  
par <- opar

r - 是否有模仿 ArcGIS 10.1 中的分组分析工具的 R 函数？

1 回答 1

Related

Reference