0

我从 Excel 工作表创建了一个数据框,然后将其过滤为[Date_rank]列中小于 10 的值。生成的数据框是filtered

然后我使用:g = groupby("Well_name")按每口井分离数据

既然我有按 分组的数据,我Well_name怎样才能找到[RandomNumber]该组中的标准偏差(为我提供两个井RandomNumber的标准差)?也许没有必要使用该groupby功能?

df = pd.read_csv('here.csv')
print(df)

filtered = df[df['Date_rank']<10] #filter the datafram to less than 10
print(filtered)

g = filtered.groupby('Well_name') #grouped the data to segregate by well name

这是我的数据

     Well_name  Date_rank  RandomNumber
0      Velta          1             4
1      Velta          2             5
2      Velta          3             2
3      Velta          4             4
4      Velta          5             4
5      Velta          6             9
6      Velta          7             0
7      Velta          8             9
8      Velta          9             1
9      Velta         10             3
10     Velta         11             8
11     Velta         12             3
12     Velta         13            10
13     Velta         14            10
14     Velta         15             0
15    Ronnie          1             8
16    Ronnie          2             1
17    Ronnie          3             6
18    Ronnie          4             2
19    Ronnie          5             2
20    Ronnie          6             9
21    Ronnie          7             6
22    Ronnie          8             5
23    Ronnie          9             2
24    Ronnie         10             1
25    Ronnie         11             3
26    Ronnie         12             3
27    Ronnie         13             4
28    Ronnie         14             0
29    Ronnie         15             4
4

1 回答 1

0

groupby()如您所说,您应该能够解决问题。您应该使用的代码如下:

g = filtered.groupby('Well_name')['RandomNumber'].std()

或使用.agg()

g = filtered.groupby('Well_name').agg({'RandomNumber':'np.std'})
于 2019-11-21T01:49:55.677 回答