假设我有一个这样的数据集:
is_a is_b is_c population infected
1 0 1 50 20
1 1 0 100 10
0 1 1 20 10
...
我如何重塑它看起来像这样?
feature 0 1
a 10/20 30/150
b 20/50 20/120
c 10/100 30/70
...
在原始数据集中,我有 features a
、b
和c
作为它们自己单独的列。在转换后的数据集中,这些相同的变量列在 column 下feature
,并生成了两个新列0
和1
,对应于这些特征可以采用的值。
在原始数据集 where is_a
is 中0
,添加infected
值并将它们除以population
值。在哪里,做同样is_a
的1
事情,添加infected
值并将它们除以population
值。冲洗并重复is_b
和is_c
。新数据集将具有这些分数(或小数),如图所示。谢谢!
我已经尝试过pd.pivot_table
,pd.melt
但没有什么能接近我所需要的。