我有一个 DataFrame,其索引city_id
格式为 city [city],[state]
(例如,new york,ny
列中包含整数计数。问题是我有同一个城市的多行,我想city_id
通过添加它们的列值来折叠共享 a 的行. 我看了看,groupby()
但如何将它应用于这个问题并不是很明显。
编辑:
一个例子:我想改变这个:
city_id val1 val2 val3
houston,tx 1 2 0
houston,tx 0 0 1
houston,tx 2 1 1
进入这个:
city_id val1 val2 val3
houston,tx 3 3 2
如果有〜10-20k行。