0

我目前正在做一个项目,我想最终运行不同的空间回归并将它们与 OLS 进行比较。

我有房地产交易的数据。这包括它们的坐标以及坐标参考系统 (EPSG:25832)。经过大量的清理和准备,我的最终数据集包含 c。6,600 次观察。

我想做的事:创建不同的空间权重矩阵(k-最近邻、距离带宽矩阵等)以用于空间回归。

到目前为止,我所做的是创建一个仅包含坐标的数据集。现在这是一个“矩阵”对象,有两列(经度和纬度坐标)和 c。6,600 行。

然后我使用 sp 包中的“SpatialPoints”函数将坐标放入 SpatialPoints 对象中:

coordinates_sp <- SpatialPoints(data_coordinates)

我现在的第一个问题是:“SpatialPoints”方法是否会自动检测相应的 CRS?是否有可能将 CRS (EPSG:25832) 输入此功能?

其次,我在 R 中绘制了坐标,它们看起来是正确绘制的,但我需要在比仅仅绘制更复杂的基础上确保正确性。这有可能吗?

然后,在第二步中,我使用我的“SpatialPoints”对象创建了一个 k = 5 的简单 k 最近邻矩阵:

knn5_matrix <- knearneigh(coordinates_sp, k = 5, longlat = TRUE)
knn5_matrix <- knn2nb(knn5_matrix)
W$knn5_matrix <- nb2listw(knn5_matrix)

然后我将矩阵转换为带有“knn2nb”的邻域对象,并最终将其转换为带有“nb2listw”的listw对象,该对象存储在一个名为“W”的列表中,其中将存储我所有的权重矩阵,以便我可以使用它带有“lagsarlm”和“errorsarlm”。

现在的问题是:

  1. 显然,数据太大以至于它可以由 R 处理(错误:无法分配大小为 1.3 Gb 的向量)
  2. 由于错误,估计需要很长时间(20-30 分钟)然后停止。

任何关于如何加快估计和处理数据大小的建议都非常受欢迎。我可能在创建权重矩阵时也犯了错误?

非常感谢您的帮助,如果有任何不清楚的地方,请告诉我!

4

0 回答 0