问题标签 [geostatistics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 变差函数中每个滞后的 R_number 对
我正在使用geoR
包进行降雨空间插值。我不得不说我对地统计学很陌生。感谢 youtube 上的一些视频教程,我理解了(嗯,我想是的)变异函数背后的理论。根据我的理解,对的数量应该随着滞后距离的增加而减少。例如,如果我们考虑一个 100m 长的延伸(例如 100m 长的河床横截面),5m 滞后的对数为 20,10m 滞后的对数为 10,依此类推。但是我对包中variog
函数的输出有点困惑。geoR
下面给出一个例子
这是我的数据集,其中a
是我的变量(降雨强度)并且x, y
是点的坐标。变异函数计算如下所示
在哪里
u:带距离的向量。
v:在 u 中给出的距离处具有估计的变异函数值的向量。
n:每个 bin 中的对数
据此,对数 (n) 具有随机模式,而相应的滞后距离 (u) 正在增加。我觉得很难理解这一点。谁能解释发生了什么?此外,由于我是地统计学新手,因此非常感谢任何改进此应用程序的变异函数计算(降雨强度的空间插值)的建议/建议。提前致谢。
r - R:理解 RMtrend 所需的帮助(RandomFields)
使用 R 包RandomFields
时,您可以通过添加不同的组件来指定描述数据空间分布的模型。
例如:数据中较近的点比较远的点彼此更熟悉,因此它们遵循指数变异函数。但是仍然存在相当多的噪音,导致您的变异函数具有块金效应。你会写:
分别添加金块。
想象一下,您的数据值作为 x 坐标的线性函数额外增加。我很确定您仍然会添加+ RMtrend()
到上述模型中,指定趋势。
这就是我现在卡住的地方。我真的没有得到help(RMtrend)
-page - 尤其是示例让我陷入困境(这个R.p
-function 有什么作用?它的帮助页面对我来说完全是胡言乱语,不知道任何C
-language)。
无论如何,RMtrend
只需要一个参数:mean
,它不能是公式,只能是数字向量或另一个RMmodel
。在我看来,好像没有RMmodel
定义线性或多项式趋势,所以我可以把它交给RMtrend
. 我也试图RMtrend
通过给它一个公式
后来给出了一个错误,说这RFformula
是被滥用了。并且似乎不可能给出RMtrend()
具有模拟网格的网格节点数长度的向量,并在每个节点处指定“平均值”(=建模趋势)。
例如,我的网格应该有 62250 点。如果我在没有趋势的情况下进行模拟,我确实得到了一个包含 249 行和 250 列的矩阵,但是如果我将一个包含 62250 个数字条目的向量RMtrend()
RFsimulate()
交给我仍然会给我一个错误(或导致 R 的致命错误):
那么如何给出RMtrend
线性或多项式趋势呢?
r - R:如何或应该在线性模型中删除无关紧要的正交多项式基?
我有像这样的 x、y 和 z 坐标的土壤水分数据:
为了估计该数据的变异函数,我需要从中删除空间趋势。当然,土壤湿度会随着地表的变化而变化——越高的点越干燥。而且由于这个土壤水分数据是按百分比计算的,这种关系几乎不是线性的,这导致我允许土壤水分对 z 坐标的三次依赖性。碰巧在这个区域有一个或多或少的椭圆形高程,所以我想让土壤水分以二次方式依赖于 x 和 y 坐标。我希望以下模型能做到这一点:
摘要告诉我,x 和 y 相关性的第一个系数(摘要名称poly(x + y, degree = 2)1
)没有意义。因为来自的帮助页面poly()
告诉我它“返回或评估 1 次正交多项式到degree
”,所以我认为,从模型中删除一次多项式可能与删除 2 次多项式的第一个系数相同。因此我尝试像这样删除它:
但是 mod 的摘要看起来和 polymod 的摘要完全一样,意思mod
和polymod
. 那么如何才能删除不重要的组件呢?
r - 如何在 R Studio 中合并绘图(图层)?
如何合并两个图(层)?在第一个图上有数据点,在第二个图中有这些点的边界。这是我所拥有的:
问题是,我想将边界与数据合并。我也想改变边界的颜色。先感谢您。
r - 为什么 gstat.predict() 函数经常返回 NaN 值(GSTAT 包)?(R 版本 3.3.2,Windows 10)
我正在尝试使用 R 中的 Gstat 包模拟两个不同的随机场(具有不同均值和相关长度的 yy1 和 yy2)与不规则边界的组合。我附上了我预期结果的图片。代码没有始终如一地提供这样的输出,我经常将 yy1 和 yy2 中的至少一个作为 NaN,这会导致如图所示的 Undesired 输出。
我使用的关键步骤是:
1) 创建了两个具有不同均值和 psill (rf1 和 rf2) 的 gstat 对象 2) 以数据框的形式创建了两个计算网格(每个随机场一个),具有两个变量“x”和“y”坐标。3) 使用无条件模拟预测两个随机场。
在这方面的任何帮助将不胜感激。
附件:2张图片(提供链接)和1个R代码
1)预期结果
2)不良结果
r - 将矢量图像置于网格中以在 R 中进行克里金法
在搜索了很多,询问并编写了一些代码之后,我有点了解在 R 的 gstat 中进行克里金法的最低要求。
使用 4 个点(我知道,非常糟糕),我对位于它们之间的未采样点进行了克里格。但实际上,我不需要所有这些点。在那个区域里面,有一个更小的分区……这个区域是我真正需要的。
长话短说……我从 4 个报告降雨数据的气象站进行了测量。这些点的经纬度坐标为:
通过我之前关于 StackOverflow 的问题可以看出我的克里金之路。
我知道图像中的坐标(至少根据我的估计):
转换将发生,但我认为这并不重要,或者以后更容易处理。
图像也是不规则的(但不是全部)。
把它想象成一个甜甜圈,你可以计算甜甜圈的整个圆形,但你只需要孔覆盖的区域,这样你就可以删除或至少忽略你从甜甜圈本身获得的值。
我有相关区域的图像 (.jpg),我必须使用 QGIS 或类似软件将图像转换为 shapefile 或其他一些矢量格式。之后,我必须将该矢量图像插入 4 点克里格区域内,这样我就知道要实际考虑哪些坐标以及要删除哪些坐标。
最后,我获取图像所覆盖区域的值并将它们存储到 csv 或数据库中。
有人知道我该如何开始吗?R和统计的总菜鸟。感谢任何回复的人。
我只是想知道它是否可能以及是否提供一些提示。再次感谢。
不妨也发布我的脚本:
编辑:自上次以来,代码已更改。但我想这并不重要,我只想知道它是否可能,任何人都可以提供最简单的例子来说明它是可能的。我可以从那里得出针对我自己的问题的示例的解决方案。
scikit-learn - 具有高斯过程的多输出空间统计
我最近一直在研究高斯过程。概率多输出的观点在我的领域很有前景。特别是空间统计。但是我遇到了三个问题:
- 多输出
- 过拟合和
- 各向异性。
meuse
让我用数据集(来自 R 包sp
)运行一个简单的案例研究。
更新:用于这个问题的 Jupyter 笔记本,并根据Grr 的回答进行了更新,在这里。
例如,我们将重点关注铜和铅。
事实上,铜和铅的浓度是相关的。
因此这是一个多输出问题。
第一个问题:当 y 具有多个维度时,内核是为相关多输出构建的吗?如果没有,我该如何指定内核?
我继续分析以显示第二个问题,过度拟合:
我创建了一个 x 和 y 坐标网格,该网格上的所有浓度都被预测为零。
最后,在土壤 3D 中特别出现的最后一个问题是:我如何在此类模型中指定各向异性?
r - 错误:“geoR”的包或命名空间加载失败:“tcltk”的 loadNamespace() 中的 .onLoad 失败
我正在尝试在 RStudio(v1.0.153,在 Ubuntu 16.04 LTS 下运行)中使用 geoR 包(v1.7-5.2),但似乎需要重新安装一些 Tcl 库:
如果我从命令行启动 geoR,那么它开始正常。
r - 为R中不同年份的数据分配坐标?
我有一个 2012 年的德国数据框,其中 8187 行包含 8187 个邮政编码(大约 10 个变量列为列),但没有坐标。此外,我还获得了具有 8203 行的不同 shapefile 的坐标(还包括几乎相同的邮政编码)。
我需要将 8203 个案例的正确坐标分配给初始数据帧的 8178 个案例。
问题:所需正确分配的差异不是 8178 缺少 16 个案例(8203 - 8187 = 16),而是更多。2012 年的一些城镇(带有邮政编码)未在最近的 shapefile 中列出,反之亦然。
(I) 也许最简单的解决方案是获取 2012 年的坐标(未投影:)CRS("+init=epsg:4326")
。--> 有人知道为此目的的开源平台吗?他们有确切的 8187 邮政编码吗?
(II)或者:有没有人有将坐标分配给不同年份的数据集的经验?- 或者,是否应该以任何方式避免这种情况,因为边界和坐标略有变化(尤其是当数据应该在 2012 年的多边形中进行映射和可视化时)以及一些未在较旧的“和”数据集中列出的城镇?
感谢您就如何处理(并希望解决)这个问题的专家建议!
编辑-MWE:
因此,
--> 未在 df2 中列出,并且:
--> 未在 df1 中列出。
关于(I)和(II)的任何想法?