lat
50.63757782
50.6375742
50.6375742
50.6374077762
50.63757782
50.6374077762
50.63757782
50.63757782
我用这些纬度值绘制了一个图表,并注意到图表中突然出现峰值(异常值)。我想用最后三个值的中值替换每个 lat 值,以便我可以看到有意义的结果
输出可能是
lat lat_med
50.63757782 50.63757782
50.6375742 50.6375742
50.6375742 50.6375742
50.63740778 50.6375742
50.63757782 50.6375742
50.63740778 50.6375742
50.63757782 50.6375742
50.63757782 50.6375742
我有数千个这样的纬度值,需要使用 for 循环来解决这个问题。我知道以下代码有错误,并且由于我是 python 的初学者,我感谢您在解决此问题方面的帮助。
for i in range(0,len(df['lat'])):
df['lat_med'][i]=numpy.median(numpy.array(df['lat'][i],df['lat'][i-2]))
我刚刚意识到三点的中位数计算不符合我的目的,我需要考虑五个值。有没有办法改变我想要的值的中值函数。谢谢您的帮助
def median(a, b, c):
if a > b and a > c:
return b if b > c else c
if a < b and a < c:
return b if b < c else c
return a