3

我需要将滚动平均值应用于 pic1 s3 中所示的列,在我应用滚动平均值并设置 windows = 5 后,我得到了正确的答案,但前 4 行为空,如图 2 sa3 所示。

我想用 pic1 s3 中所有数据的平均值填充 pic2 sa3 中的前 4 个空单元格,直到当前行,如 pic3 a3 所示。

除了滚动平均方法之外,我如何使用简单的功能。 图1

图2

图3

4

4 回答 4

3

我认为需要min_periods=1参数rolling

min_periods : 整数,默认无

具有值所需的窗口中的最小观察数(否则结果为 NA)。对于由偏移量指定的窗口,这将默认为 1。

df = df.rolling(5, min_periods=1).mean()

样品

np.random.seed(1256)

df = pd.DataFrame(np.random.randint(10, size=(10, 5)), columns=list('abcde'))
print (df)
   a  b  c  d  e
0  1  5  8  8  9
1  3  6  3  0  6
2  7  0  1  5  1
3  6  6  5  0  4
4  4  9  4  6  1
5  7  7  5  8  3
6  0  7  2  8  2
7  4  8  3  5  5
8  8  2  0  9  2
9  4  7  1  5  1

df = df.rolling(5, min_periods=1).mean()
print (df)
          a         b     c         d         e
0  1.000000  5.000000  8.00  8.000000  9.000000
1  2.000000  5.500000  5.50  4.000000  7.500000
2  3.666667  3.666667  4.00  4.333333  5.333333
3  4.250000  4.250000  4.25  3.250000  5.000000
4  4.200000  5.200000  4.20  3.800000  4.200000
5  5.400000  5.600000  3.60  3.800000  3.000000
6  4.800000  5.800000  3.40  5.400000  2.200000
7  4.200000  7.400000  3.80  5.400000  3.000000
8  4.600000  6.600000  2.80  7.200000  2.600000
9  4.600000  6.200000  2.20  7.000000  2.600000
于 2018-06-26T13:02:20.473 回答
0

所以你想添加:

df['sa3'].fillna(df['s3'].mean(), inplace=True)

希望我使用了正确的列名。

于 2018-06-26T12:50:21.053 回答
0

您可以使用 pandas 找到滚动平均值,然后NaN用零填充。

使用类似下面的东西:

col = [1,2,3,4,5,6,7,8,9]
df = pd.DataFrame(col)

df['rm'] = df.rolling(5).mean().fillna(value =0, inplace=False)
print df

   0   rm
0  1  0.0
1  2  0.0
2  3  0.0
3  4  0.0
4  5  3.0
5  6  4.0
6  7  5.0
7  8  6.0
8  9  7.0
于 2018-06-26T12:53:27.477 回答
0

我明白了,一些答案正在处理 null 并用平均值替换它们,而一些答案正在创建滚动平均值,但没有用它替换 null。所以我自己想出了代码并将其发布在这里。

df['Col']= df['Col'].fillna(df['Col'].rolling(4,center=True,min_periods=1).mean())

'4'是滚动窗口的长度, centre = True表示被替换的值将考虑替换空值的上半部分和下半部分的值。

于 2021-02-19T11:01:32.440 回答