1

我最近开始使用由医疗急救服务提供的庞大数据集。我有大约 25.000 个空间点的事件。

我在书籍和互联网上搜索了相当长的一段时间,并且越来越不知道该做什么以及如何去做。

当然,这些点非常聚集。我为它计算了 K、L 和 G 函数,它们证实了严重的聚类。

我还有人口点数据集——每个公民一个点,它与事件数据集类似地聚集在一起(事件发生在人身上,因此这两个数据集之间有很强的联系)。

我想比较这两个数据集以确定它们是否分布相似。我想知道,与人口相比,是否有地方发生了更多的事件。换句话说,我想使用人口数据集来解释强度,然后确定事件数据集是否对应于该强度。假设是,关于人口,事件应该随机出现。

如果事件是随机发生在人们身上,我想获得该区域的信息,其中的事件比预期的多或少。

你会如何用 R 来做呢?

我应该使用 Kest 还是 Kinhom 来计算 K 函数?我阅读了描述,但仍然不明白它们之间的基本区别是什么。

我尝试使用 Kcross,但我发现,使用的两个数据集之一应该是 CSR - 完全空间随机。我还找到了 Kcross.inhom,我应该将那个用于我的数据吗?

如何获得关于人口的事件偏差图(图像)?

我希望我问清楚了。

感谢您花时间阅读我的问题,如果您能回答我的任何问题,则更加感谢。

此致!

耶内伊

4

1 回答 1

3

我没有时间完整回答您的所有问题,但这里有一些建议。

免责声明:我是该spatstat软件包和《空间点模式:R 方法论和应用》一书的合著者,因此我更喜欢使用这些(我真的相信这些是解决您的问题的最佳工具)。

概念性问题:您的研究区域有多大?将这些点视为分布在该区域的任何地方是否有意义,或者它们是否仅限于道路网络?

现在我假设我们可以假设它们分布在任何地方。

一种简单的方法是使用 估计人口密度density.ppp,然后将泊松模型拟合到以人口密度为强度的事件中,使用ppm。这可能是一个合理的空模型,如果它很好地拟合数据,您基本上可以说事件“在控制不均匀的人口密度时在空间中完全随机发生”。更多信息density.ppp分别ppm在 1 的第 6 章和第 9 章中当然也在spatstat帮助文件中。

如果您使用 K/L/G/F/J 函数等汇总统计数据,则应始终使用inhom版本来考虑人口密度。这在 1 的第 7 章中有介绍

relrisk此外,如果您将所有点组合成具有两种类型(背景和事件)的标记点模式,查看相对风险 ( ) 可能会很有趣。见第 14 章,共1章。

不幸的是,只有第 3 章、第 7 章和第 9 章(共1 章)可免费下载示例章节,但我希望您可以在图书馆访问它或可以选择购买它。

于 2016-08-03T09:39:05.273 回答