7

是否有一个函数来强制索引是唯一的,或者它是否只能通过转换为 dict 并返回或类似的东西在 python '本身' 中处理这个?

如以下评论中所述:python pandas 是一个基于 numpy/scipy 构建的项目。

to_dict 和 back 有效,但我敢打赌,当你变大时,这会变慢。

In [24]: a = pandas.Series([1,2,3], index=[1,1,2])

In [25]: a
Out[25]: 
1    1
1    2
2    3

In [26]: a = a.to_dict()

In [27]: a
Out[27]: {1: 2, 2: 3}

In [28]: a = pandas.Series(a)

In [29]: a
Out[29]: 
1    2
2    3
4

2 回答 2

7

顺便说一句,我们计划在不久的将来drop_duplicates向 Series 添加一个方法。DataFrame.drop_duplicates

于 2012-10-20T15:20:44.670 回答
4

使用groupbylast()

In [279]: s
Out[279]: 
a    1
b    2
b    3
b    4
e    5

In [280]: grouped = s.groupby(level=0)

In [281]: grouped.first()
Out[281]: 
a    1
b    2
e    5

In [282]: grouped.last()
Out[282]: 
a    1
b    4
e    5
于 2012-10-18T20:07:06.083 回答