我最近编写了一个脚本,用于从 Twitter 的流 API中捕获大量地理数据。我正在寻找某种方法来创建一个模型,以使用数据作为训练输入来表示世界上任何给定 lat/lng 点的地理“活动”。
我正在考虑将所有 lat\lng 舍入到小数点后两位,并创建所有位置出现的二维直方图。因此用于训练我的模型的输入将是:
x = lat - input
y = lng - input
z = location weight - observed output [normalized between 0.0 and 1.0]
我正在考虑创建 24 个模型(每小时 1 个)来模拟社交网络活动取决于一天中的时间这一事实。这也会将事物简化为 3-d 而不是 4-d。
问题:
- 曲线拟合上述问题的最佳方法是什么?
- 是否有一个现有的库可以用来输入 x、y、z 并吐出最佳拟合回归方程?我熟悉 Ruby、Python、Java 或 Scala。示例代码将不胜感激。