r - 使用 R 在 lpp 上测试 CSR

Question

我最近发布了一个关于正确方法的“R 非常新手”问题，如果您对此感兴趣，可以在 [此处] 找到它。1

我现在设法开发了一个简单的 R 脚本来完成这项工作，但现在的结果让我很困扰。

长话短说，我正在使用 R 来分析lpp（线性点模式）mad.test。该函数执行假设检验，其中零假设是点是随机分布的。目前我有88个lpps要分析，根据其中p.value86个是随机分布的，其中2个不是。

这是两个非随机分布的 lpp。

看着它们，您可以在第一个中看到某种簇，但第二个只有三个点，在我看来，无法保证只有三个点不对应于随机分布。还有其他带有一、二、三点的曲目，但它们都属于“随机” lpps 类别，所以我不知道为什么这个不同。

那么问题来了：多少分对于 CSR 测试来说太少了？

我还注意到这两个 lpp$statistic$rank比其他 lpp 低得多。我试图找出这意味着什么，但我现在一无所知，所以这是另一个新手问题：是$statistic$rank某种质量分析指标，因此我可以使用它将我的 lpp 分析分组为“重要的”和“积分太少？

我的 R 脚本和所有 shp 文件都可以从这里下载(850 Kb)。

非常感谢你的帮助。

score 1 · Accepted Answer

对于分析需要多少点的问题，不可能给出一个普遍的答案。通常 0、1 和 2 对于独立分析来说太少了。但是，如果它们是对同一事物的重复测量的一部分，它们可能仍然很有趣。另外，我通常会说您的 3 分示例太少，无法说出任何有趣的内容。但是，一个极端的例子是，如果您有一条长线段，其中一个点靠近一端，另外两个点在另一端彼此靠近。CSR 不太可能发生这种情况，您可能倾向于不相信该假设。这似乎是你的情况发生的事情。

关于您关于排名的问题，您可能需要更多地了解您正在执行的蒙特卡洛测试。基本上，您通过单个数字（线性 K 的最大绝对偏差）总结点模式，然后您查看该数字与 CSR 随机生成的数字相比有多极端。假设您使用 99 个 CSR 模拟，您总共有 100 个数字。如果您的数据在这些数据中排名最极端 ( $statistic$rank==1)，则它的 p 值为 1%。如果它排在第 50 个数字，则 p 值为 50%。如果您使用了其他数量的模拟，则必须相应地计算。即 199 次模拟排名 1 为 0.5%，排名 2 为 1%，依此类推。

score 0 · Accepted Answer

多重测试存在一个根本问题。您正在应用假设检验 88 次。该测试（默认情况下）设计为在 5%（20 分之 1）的应用程序中给出误报，因此如果原假设为真，您应该预期 88 /20 = 4.4 误报发生在您的 88 次测试中。因此，仅获得 2 个阳性结果（“非随机”）与所有模式都是随机的零假设完全一致。我的结论是模式是随机的。

r - 使用 R 在 lpp 上测试 CSR

2 回答 2

Related

Reference