2

我是 R 新手,它用于时空数据。在过去的几周里,我学习了 R 的基础知识,并试图找到合适的包/合适的函数来创建时空预测模型。

我发现了几个用于各种时空分析方法的包(例如 SpaatioTemporal、spTimer 等),但是,我发现其中一些函数/包非常复杂,挖掘它们通常会导致发现可能证明它们不合适的问题对于我的数据或我的研究目的。所以我很难确定哪些包和功能适合我的数据和我的研究目的。搜索关于 SO 的主题似乎有不少专家使用 R 进行(时空)分析。所以我希望你们中的一个可以为我提供一些关于适合的包和功能的确定性我的研究。

研究:我的研究目的是创建一个时空预测模型,该模型可以根据地理标记的推特消息预测城市内发生暴力犯罪的概率。

数据:我的数据有两个主要组成部分:事件和推文

事件:我在城市内有两个单独的事件数据集(两个不同的时间段),其中包括城市内的暴力犯罪事件(每一行作为单独的案例/事件)。相关列包括:Datetime(Y%-m%-d% H%:M%, as POSIXct(for now))LatitudeLongitude坐标(单独的变量)。因此,这些包括事件的日期和时间以及事件点位置的纬度/经度坐标。

推文:该数据集包括从城市内部发送的推文(涵盖上述时间段),这些推文使用指示某些活动/情绪状态的关键字进行汇总。与事件数据一样,该集合包括:(Datetime格式与上述相同)LatitudeLongitude坐标。并且(除其他外)还有一个变量,该变量Keywordcluster指示包含在推文中找到的相关关键字的集群(21 个集群包含与不同类型的活动或情绪状态相关的关键字)。

因此,事件和推文都包含指示确切时间和确切点位置(如纬度和经度坐标)的列。目的是使用不同推文中普遍存在的不同关键词集群(例如:一个集群包含与饮酒相关的关键词)来预测区域内发生暴力犯罪事件的概率。

由于目标是根据推特消息预测暴力犯罪,因此模型最好只考虑事件发生前(在短时间内)发送的推文(例如:最多 24 小时内发送的推文)在事件发生之前)。目的是提供在某些短时间跨度(例如几小时或最多几天,由于数据的性质(即不使用推文来预测事件的发生)之间的某些区域内发生暴力犯罪的概率)一周后))。

我希望这能为我的数据和我的研究目的提供充分的解释。如果你们中的某个人能提供一些关于哪些包和功能应该合适的确定性(也许还有一些额外的提示),我将非常感激。这对我真的有很大帮助!

在此先感谢,M. Stam

4

0 回答 0