python - 根据条件匹配其他列中的行值更新列

Question

我需要根据它们在其他列中包含的值，用更新的值替换以 _4 结尾的列中的值。如果前 3 列包含 1，则第四列应为零。如果前三列包含零，则第四列应为 1。

在下面的代码中，我想将此计数 var 分配为与公共列（即 a 或 b）具有相同的名称 - 然后用这个新的计数列替换原始数据框中的 x'_4' 列但是它也不是正确计数，因为当前 a 和 b 的计数。欢迎任何评论。谢谢

import pandas as pd
import numpy as np 

df = pd.DataFrame({ 'a_1':[1, 0, 0, 0],
                    'a_2':[0, 0, 0, 1],
                    'a_3':[0, 0, 0, 0],
                    'a_4':[1, 0, 1, 1],
                  
                    'b_1':[0, 0, 0, 1],
                    'b_2':[0, 0, 0, 1],
                    'b_3':[1, 1, 0, 0],
                    'b_4':[0, 1, 0, 1]})

我当前的代码看起来像这样

out = []
counts = []

col_list = ('a','b')

for col in col_list:

    
    d = df.loc[:,df.columns.str.startswith(col)]
    dat = df.loc[:, ~df.columns.str.endswith('4')]
    counts = dat[(dat.isin([1]).any(1).astype(int))|(d.isin([1]).all(0).astype(int))]
    counts^=1
    counts_df = pd.DataFrame(counts)
    out.append(counts_df)

原始数据框中被覆盖的列应如下所示

score 1 · Accepted Answer

尝试通过filter()并获取列名，例如'_4'：

cols=df.filter(like='_4').columns

最后：

df[cols]=(df.filter(regex='_[0-3]')
            .rename(columns=lambda x:x.split('_')[0])
            .groupby(axis=1,level=0).sum().eq(0).astype(int))

输出df：

        a_1     a_2     a_3     a_4     b_1     b_2     b_3     b_4
0       1       0       0       0       0       0       1       0
1       0       0       0       1       0       0       1       0
2       0       0       0       1       0       0       0       1
3       0       1       0       0       1       1       0       0

python - 根据条件匹配其他列中的行值更新列

1 回答 1

Related

Reference