0

我正在寻找做我认为是一项简单的任务。我有一个大型数据集,它是在 python 中的各种 if 条件下创建的。如:

    for index, row in df.iterrows():
        if int(row['Fog_Event']) >= 4:
            df.at[index, 'Fog_Event_determine'] = 'Fog'
        elif int(row['Fog_Event']) == 3:
            df.at[index, 'Fog_Event_determine'] = 'Dust'
        elif int(row['Fog_Event']) == 2:
            df.at[index, 'Fog_Event_determine'] = 'Dust'
        else:
            df.at[index, 'Fog_Event_determine'] = 'Background'
            continue

这些工作完美地完成了我希望他们做的事情,但是对数据的最终分析存在一些问题。要解决此问题,我需要添加一个基于前一行结果的运行阈值。因此,如果第 1 行 >=4:那么我希望第 2 行为 +1。

我试过这个:

df['Running_threshold'] = 0

for index, row in df.iterrows():
    if int(row['Fog_Event']) >= 4:
        df.loc[index[+1], 'Running_threshold'] = 1
    else:
        continue

但这只会将 1 添加到索引的第二行,这在查看它时是有意义的。在满足条件 ['Fog_Event']) >= 4 后,如何要求 python 为每一行添加 +1?

谢谢你。

4

1 回答 1

1
  • 使用 if 逻辑,np.where()因为它比循环更有效
  • 首先根据前一行条件将Running_threshold设置为零或一
  • 正如你所说,cumsum()它得到运行总数
df = pd.DataFrame({"Fog_Event":np.random.randint(0, 10,20)})

df = df.assign(Fog_Event_Determine=np.where(df.Fog_Event>=4, "fog", np.where(df.Fog_Event>=2, "dust", "background"))
        , Running_threshold=np.where(df.Fog_Event.shift()>=4,1,0)
).assign(Running_threshold=lambda dfa: dfa.Running_threshold.cumsum())

输出

 Fog_Event Fog_Event_Determine  Running_threshold
         9                 fog                  0
         3                dust                  1
         2                dust                  1
         9                 fog                  1
         7                 fog                  2
         0          background                  3
         4                 fog                  3
         7                 fog                  4
         6                 fog                  5
         9                 fog                  6
         1          background                  7
         6                 fog                  7
         7                 fog                  8
         8                 fog                  9
         6                 fog                 10
         9                 fog                 11
         6                 fog                 12
         2                dust                 13
         7                 fog                 13
         8                 fog                 14
于 2021-02-01T16:01:21.253 回答