2

我正在尝试根据拍摄地点和拍摄时间对照片进行聚类。我的聚类算法要求我在每两个点之间定义一个距离函数(在这种情况下,每两张图片。)

对时间参数进行良好转换的任何想法?我曾考虑过使用欧几里得距离作为纬度/经度,但我不知道时间参数需要哪种转换来计算受时间影响的距离。

4

1 回答 1

3

尝试使用例如 DBSCAN。如果您查看通用版本(GDBSCAN),很明显您还可以同时定义两个阈值参数,一个空间阈值(例如,100 米)和一个时间阈值(例如 1 天)。

这是广义 DBSCAN 框架内 DBSCAN 的直接扩展。

用索引来加速你的算法会有点棘手,但是 ELKI 应该足够灵活以允许这样的扩展并且非常快。

至于纬度/经度,不要在 latitude-longitude 上使用欧几里得距离。如果您首先将数据投影到本地坐标系中,例如单个 UTM 区域,则可以(如果您的数据跨越整个地球,这将不起作用)。但是使用大圆近似值之一。ELKI 已经为此提供了索引支持,您应该能够轻松添加时间组件(特别是,因为您只需要阈值)。

于 2013-07-22T19:53:40.467 回答