我正在分析一些地理数据,并试图根据时间和地理位置来预测/预测下一次事件的发生。数据按以下顺序(带有样本数据)
时间戳纬度经度事件 13307266 102.86400972 70.64039541 “事件 A” 13311695 102.8082912 70.47394645 “事件 A” 13314940 102.82240522 70.6308513 “事件 A” 13318949 102.83402128 70.64103035 “事件 A” 13334397 102.84726242 70.66790352 “事件 A”
第一步是将其分为 100 个区域,以减少尺寸和复杂性。
时间戳区 13307266 47 13311695 65 13314940 51 13318949 46 13334397 26
下一步是进行时间序列分析,然后我被困在这里 2 个月,阅读了很多文献并认为这些是我的选择 * ARIMA(自动回归方法) * 机器学习
我想利用机器学习来使用 python 进行预测,但无法真正弄清楚如何。具体来说,是否有任何特定于用例的 python 库/开源代码,我可以在这些库上进行构建。
编辑1:为了澄清,数据松散地依赖于过去的数据,但在一段时间内是均匀分布的。可视化数据的最佳方式是,想象由算法控制的 N 个代理,该算法分配给它们从网格中挑选资源的任务。资源是社会经济结构的功能,也强烈依赖于地理。“算法”的兴趣在于能够明智地预测需求区域和时间。
ps:对于像 ARIMA 这样的自回归模型,Python 已经有一个库http://pypi.python.org/pypi/statsmodels。