0

我最近发布了一个关于正确方法的“R 非常新手”问题,如果您对此感兴趣,可以在 [此处] 找到它。1

我现在设法开发了一个简单的 R 脚本来完成这项工作,但现在的结果让我很困扰。

长话短说,我正在使用 R 来分析lpp(线性点模式)mad.test。该函数执行假设检验,其中零假设是点是随机分布的。目前我有88个lpps要分析,根据其中p.value86个是随机分布的,其中2个不是。

这是两个非随机分布的 lpp。 在此处输入图像描述 在此处输入图像描述

看着它们,您可以在第一个中看到某种簇,但第二个只有三个点,在我看来,无法保证只有三个点不对应于随机分布。还有其他带有一、二、三点的曲目,但它们都属于“随机” lpps 类别,所以我不知道为什么这个不同。

那么问题来了:多少分对于 CSR 测试来说太少了?

我还注意到这两个 lpp$statistic$rank比其他 lpp 低得多。我试图找出这意味着什么,但我现在一无所知,所以这是另一个新手问题:$statistic$rank某种质量分析指标,因此我可以使用它将我的 lpp 分析分组为“重要的”和“积分太少?

我的 R 脚本和所有 shp 文件都可以从这里下载(850 Kb)。

非常感谢你的帮助。

4

2 回答 2

1

对于分析需要多少点的问题,不可能给出一个普遍的答案。通常 0、1 和 2 对于独立分析来说太少了。但是,如果它们是对同一事物的重复测量的一部分,它们可能仍然很有趣。另外,我通常会说您的 3 分示例太少,无法说出任何有趣的内容。但是,一个极端的例子是,如果您有一条长线段,其中一个点靠近一端,另外两个点在另一端彼此靠近。CSR 不太可能发生这种情况,您可能倾向于不相信该假设。这似乎是你的情况发生的事情。

关于您关于排名的问题,您可能需要更多地了解您正在执行的蒙特卡洛测试。基本上,您通过单个数字(线性 K 的最大绝对偏差)总结点模式,然后您查看该数字与 CSR 随机生成的数字相比有多极端。假设您使用 99 个 CSR 模拟,您总共有 100 个数字。如果您的数据在这些数据中排名最极端 ( $statistic$rank==1),则它的 p 值为 1%。如果它排在第 50 个数字,则 p 值为 50%。如果您使用了其他数量的模拟,则必须相应地计算。即 199 次模拟排名 1 为 0.5%,排名 2 为 1%,依此类推。

于 2017-08-28T08:22:52.567 回答
0

多重测试存在一个根本问题。您正在应用假设检验 88 次。该测试(默认情况下)设计为在 5%(20 分之 1)的应用程序中给出误报,因此如果原假设为真,您应该预期 88 /20 = 4.4 误报发生在您的 88 次测试中。因此,仅获得 2 个阳性结果(“非随机”)与所有模式都是随机的零假设完全一致。我的结论是模式是随机的。

于 2017-08-29T01:16:53.287 回答