拥有一个预测模型输出的数据框,该数据框被分成三分位数(低风险、中风险和高风险)。我想计算每个风险区域中具有感兴趣结果的人的百分比。
import pandas as pd
data = {'risk_group': ["medium", "low", "high", "low", "high", "high", ....],
'outcome': [1, 0, 1, 0, 1, 1, ....}
df = pd.DataFrame (data, columns = ['risk_group','outcome'])
理论上期望的输出是一个具有
low : 12% w/ outcome
medium : 34% w/ outcome
high: 78% w/ outcome