0

我正在努力寻找与天气相关的数据中的统计异常值。更具体地说,我有在特定时间记录温度的 10000 个数据点的温度和位置(经度和纬度)。什么是定位与地理天气相关的异常值并以异常值显着可见的方式可视化数据的最佳方法。对于可视化部分,python 工具将是最受赞赏的,而定位异常值部分的算法或技术将是最有用的。(我在考虑集群)

4

1 回答 1

0

这真的取决于你将如何使用它。您确实提到了异常值,因此可以使用 DBSCAN(它本质上是创建集群,并且不在集群中的点被视为异常值)。

如果您只关心哪些点是异常值,而不是哪些点是聚类的,您可以使用例如 Isolation Forrest

于 2021-06-18T05:23:04.990 回答