问题标签 [geostatistics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
576 浏览

r - 变差函数中每个滞后的 R_number 对

我正在使用geoR包进行降雨空间插值。我不得不说我对地统计学很陌生。感谢 youtube 上的一些视频教程,我理解了(嗯,我想是的)变异函数背后的理论。根据我的理解,对的数量应该随着滞后距离的增加而减少。例如,如果我们考虑一个 100m 长的延伸(例如 100m 长的河床横截面),5m 滞后的对数为 20,10m 滞后的对数为 10,依此类推。但是我对包中variog函数的输出有点困惑。geoR下面给出一个例子

这是我的数据集,其中a是我的变量(降雨强度)并且x, y是点的坐标。变异函数计算如下所示

在哪里

u:带距离的向量。

v:在 u 中给出的距离处具有估计的变异函数值的向量。

n:每个 bin 中的对数

据此,对数 (n) 具有随机模式,而相应的滞后距离 (u) 正在增加。我觉得很难理解这一点。谁能解释发生了什么?此外,由于我是地统计学新手,因此非常感谢任何改进此应用程序的变异函数计算(降雨强度的空间插值)的建议/建议。提前致谢。

0 投票
0 回答
235 浏览

r - R:理解 RMtrend 所需的帮助(RandomFields)

使用 R 包RandomFields时,您可以通过添加不同的组件来指定描述数据空间分布的模型。
例如:数据中较近的点比较远的点彼此更熟悉,因此它们遵循指数变异函数。但是仍然存在相当多的噪音,导致您的变异函数具有块金效应。你会写:

分别添加金块。
想象一下,您的数据值作为 x 坐标的线性函数额外增加。我很确定您仍然会添加+ RMtrend()到上述模型中,指定趋势。
这就是我现在卡住的地方。我真的没有得到help(RMtrend)-page - 尤其是示例让我陷入困境(这个R.p-function 有什么作用?它的帮助页面对我来说完全是胡言乱语,不知道任何C-language)。

无论如何,RMtrend只需要一个参数:mean,它不能是公式,只能是数字向量或另一个RMmodel。在我看来,好像没有RMmodel定义线性或多项式趋势,所以我可以把它交给RMtrend. 我也试图RMtrend通过给它一个公式

后来给出了一个错误,说这RFformula是被滥用了。并且似乎不可能给出RMtrend()具有模拟网格的网格节点数长度的向量,并在每个节点处指定“平均值”(=建模趋势)。
例如,我的网格应该有 62250 点。如果我在没有趋势的情况下进行模拟,我确实得到了一个包含 249 行和 250 列的矩阵,但是如果我将一个包含 62250 个数字条目的向量RMtrend() RFsimulate()交给我仍然会给我一个错误(或导致 R 的致命错误):

那么如何给出RMtrend线性或多项式趋势呢?

0 投票
1 回答
579 浏览

r - R:如何或应该在线性模型中删除无关紧要的正交多项式基?

我有像这样的 x、y 和 z 坐标的土壤水分数据:

为了估计该数据的变异函数,我需要从中删除空间趋势。当然,土壤湿度会随着地表的变化而变化——越高的点越干燥。而且由于这个土壤水分数据是按百分比计算的,这种关系几乎不是线性的,这导致我允许土壤水分对 z 坐标的三次依赖性。碰巧在这个区域有一个或多或少的椭圆形高程,所以我想让土壤水分以二次方式依赖于 x 和 y 坐标。我希望以下模型能做到这一点:

摘要告诉我,x 和 y 相关性的第一个系数(摘要名称poly(x + y, degree = 2)1)没有意义。因为来自的帮助页面poly()告诉我它“返回或评估 1 次正交多项式到degree”,所以我认为,从模型中删除一次多项式可能与删除 2 次多项式的第一个系数相同。因此我尝试像这样删除它:

但是 mod 的摘要看起来和 polymod 的摘要完全一样,意思modpolymod. 那么如何才能删除不重要的组件呢?

0 投票
1 回答
520 浏览

r - 如何在 R Studio 中合并绘图(图层)?

如何合并两个图(层)?在第一个图上有数据点,在第二个图中有这些点的边界。这是我所拥有的:

问题是,我想将边界与数据合并。我也想改变边界的颜色。先感谢您。

0 投票
0 回答
118 浏览

r - 为什么 gstat.predict() 函数经常返回 NaN 值(GSTAT 包)?(R 版本 3.3.2,Windows 10)

我正在尝试使用 R 中的 Gstat 包模拟两个不同的随机场(具有不同均值和相关长度的 yy1 和 yy2)与不规则边界的组合。我附上了我预期结果的图片。代码没有始终如一地提供这样的输出,我经常将 yy1 和 yy2 中的至少一个作为 NaN,这会导致如图所示的 Undesired 输出。

我使用的关键步骤是:

1) 创建了两个具有不同均值和 psill (rf1 和 rf2) 的 gstat 对象 2) 以数据框的形式创建了两个计算网格(每个随机场一个),具有两个变量“x”和“y”坐标。3) 使用无条件模拟预测两个随机场。

在这方面的任何帮助将不胜感激。

附件:2张图片(提供链接)和1个R代码

1)预期结果

2)不良结果

0 投票
2 回答
846 浏览

r - 将矢量图像置于网格中以在 R 中进行克里金法

在搜索了很多,询问并编写了一些代码之后,我有点了解在 R 的 gstat 中进行克里金法的最低要求。

使用 4 个点(我知道,非常糟糕),我对位于它们之间的未采样点进行了克里格。但实际上,我不需要所有这些点。在那个区域里面,有一个更小的分区……这个区域是我真正需要的。

长话短说……我从 4 个报告降雨数据的气象站进行了测量。这些点的经纬度坐标为:

通过我之前关于 StackOverflow 的问题可以看出我的克里金之路。

这:在 R 的 gstat 包中创建变异函数

这:在 R 中为 gstat 中的克里金法创建网格

我知道图像中的坐标(至少根据我的估计):

转换将发生,但我认为这并不重要,或者以后更容易处理。

图像也是不规则的(但不是全部)。

把它想象成一个甜甜圈,你可以计算甜甜圈的整个圆形,但你只需要孔覆盖的区域,这样你就可以删除或至少忽略你从甜甜圈本身获得的值。

我有相关区域的图像 (.jpg),我必须使用 QGIS 或类似软件将图像转换为 shapefile 或其他一些矢量格式。之后,我必须将该矢量图像插入 4 点克里格区域内,这样我就知道要实际考虑哪些坐标以及要删除哪些坐标。

最后,我获取图像所覆盖区域的值并将它们存储到 csv 或数据库中。

有人知道我该如何开始吗?R和统计的总菜鸟。感谢任何回复的人。

我只是想知道它是否可能以及是否提供一些提示。再次感谢。

不妨也发布我的脚本:

编辑:自上次以来,代码已更改。但我想这并不重要,我只想知道它是否可能,任何人都可以提供最简单的例子来说明它是可能的。我可以从那里得出针对我自己的问题的示例的解决方案。

0 投票
1 回答
1281 浏览

scikit-learn - 具有高斯过程的多输出空间统计

我最近一直在研究高斯过程。概率多输出的观点在我的领域很有前景。特别是空间统计。但是我遇到了三个问题:

  1. 多输出
  2. 过拟合和
  3. 各向异性。

meuse让我用数据集(来自 R 包sp)运行一个简单的案例研究。

更新:用于这个问题的 Jupyter 笔记本,并根据Grr 的回答进行了更新,在这里

例如,我们将重点关注铜和铅。

在此处输入图像描述

事实上,铜和铅的浓度是相关的。

在此处输入图像描述

因此这是一个多输出问题。

第一个问题:当 y 具有多个维度时,内核是为相关多输出构建的吗?如果没有,我该如何指定内核?

我继续分析以显示第二个问题,过度拟合

在此处输入图像描述

我创建了一个 x 和 y 坐标网格,该网格上的所有浓度都被预测为零。

最后,在土壤 3D 中特别出现的最后一个问题是:我如何在此类模型中指定各向异性?

0 投票
0 回答
142 浏览

geostatistics - 如何将空间点数据框转换为多边形和空间多边形

经过几天的试用 n 在线搜索,我未能将空间点数据框转换为多边形,然后转换为空间多边形。

数据(来自 DHS 的典型地理数据)共有 400 个集群。这是数据页面的网址:

在此处输入图像描述

为了运行“Bayes_cluster”程序,我需要创建这个多边形和空间多边形以在 SpatialEpi r 包中创建一个 sp.object。如何为集群实施省级(津巴布韦 Admin_level 1)估计?我的目标是估计单个集群和省级的重要 HIV 热点。

我的代码:

0 投票
1 回答
881 浏览

r - 错误:“geoR”的包或命名空间加载失败:“tcltk”的 loadNamespace() 中的 .onLoad 失败

我正在尝试在 RStudio(v1.0.153,在 Ubuntu 16.04 LTS 下运行)中使用 geoR 包(v1.7-5.2),但似乎需要重新安装一些 Tcl 库:

如果我从命令行启动 geoR,那么它开始正常。

0 投票
0 回答
43 浏览

r - 为R中不同年份的数据分配坐标?

我有一个 2012 年的德国数据框,其中 8187 行包含 8187 个邮政编码(大约 10 个变量列为列),但没有坐标。此外,我还获得了具有 8203 行的不同 shapefile 的坐标(还包括几乎相同的邮政编码)。

我需要将 8203 个案例的正确坐标分配给初始数据帧的 8178 个案例。

问题:所需正确分配的差异不是 8178 缺少 16 个案例(8203 - 8187 = 16),而是更多。2012 年的一些城镇(带有邮政编码)未在最近的 shapefile 中列出,反之亦然。

(I) 也许最简单的解决方案是获取 2012 年的坐标(未投影:)CRS("+init=epsg:4326")。--> 有人知道为此目的的开源平台吗?他们有确切的 8187 邮政编码吗?

(II)或者:有没有人有将坐标分配给不同年份的数据集的经验?- 或者,是否应该以任何方式避免这种情况,因为边界和坐标略有变化(尤其是当数据应该在 2012 年的多边形中进行映射和可视化时)以及一些未在较旧的“和”数据集中列出的城镇?

感谢您就如何处理(并希望解决)这个问题的专家建议!

编辑-MWE:

因此,

--> 未在 df2 中列出,并且:

--> 未在 df1 中列出。

关于(I)和(II)的任何想法?