我需要将滚动平均值应用于 pic1 s3 中所示的列,在我应用滚动平均值并设置 windows = 5 后,我得到了正确的答案,但前 4 行为空,如图 2 sa3 所示。
我想用 pic1 s3 中所有数据的平均值填充 pic2 sa3 中的前 4 个空单元格,直到当前行,如 pic3 a3 所示。
我需要将滚动平均值应用于 pic1 s3 中所示的列,在我应用滚动平均值并设置 windows = 5 后,我得到了正确的答案,但前 4 行为空,如图 2 sa3 所示。
我想用 pic1 s3 中所有数据的平均值填充 pic2 sa3 中的前 4 个空单元格,直到当前行,如 pic3 a3 所示。
我认为需要min_periods=1
参数rolling
:
min_periods : 整数,默认无
具有值所需的窗口中的最小观察数(否则结果为 NA)。对于由偏移量指定的窗口,这将默认为 1。
df = df.rolling(5, min_periods=1).mean()
样品:
np.random.seed(1256)
df = pd.DataFrame(np.random.randint(10, size=(10, 5)), columns=list('abcde'))
print (df)
a b c d e
0 1 5 8 8 9
1 3 6 3 0 6
2 7 0 1 5 1
3 6 6 5 0 4
4 4 9 4 6 1
5 7 7 5 8 3
6 0 7 2 8 2
7 4 8 3 5 5
8 8 2 0 9 2
9 4 7 1 5 1
df = df.rolling(5, min_periods=1).mean()
print (df)
a b c d e
0 1.000000 5.000000 8.00 8.000000 9.000000
1 2.000000 5.500000 5.50 4.000000 7.500000
2 3.666667 3.666667 4.00 4.333333 5.333333
3 4.250000 4.250000 4.25 3.250000 5.000000
4 4.200000 5.200000 4.20 3.800000 4.200000
5 5.400000 5.600000 3.60 3.800000 3.000000
6 4.800000 5.800000 3.40 5.400000 2.200000
7 4.200000 7.400000 3.80 5.400000 3.000000
8 4.600000 6.600000 2.80 7.200000 2.600000
9 4.600000 6.200000 2.20 7.000000 2.600000
所以你想添加:
df['sa3'].fillna(df['s3'].mean(), inplace=True)
希望我使用了正确的列名。
您可以使用 pandas 找到滚动平均值,然后NaN
用零填充。
使用类似下面的东西:
col = [1,2,3,4,5,6,7,8,9]
df = pd.DataFrame(col)
df['rm'] = df.rolling(5).mean().fillna(value =0, inplace=False)
print df
0 rm
0 1 0.0
1 2 0.0
2 3 0.0
3 4 0.0
4 5 3.0
5 6 4.0
6 7 5.0
7 8 6.0
8 9 7.0
我明白了,一些答案正在处理 null 并用平均值替换它们,而一些答案正在创建滚动平均值,但没有用它替换 null。所以我自己想出了代码并将其发布在这里。
df['Col']= df['Col'].fillna(df['Col'].rolling(4,center=True,min_periods=1).mean())
'4'
是滚动窗口的长度,
centre = True
表示被替换的值将考虑替换空值的上半部分和下半部分的值。