假设我有一个DataFrame
100k 行和一个列name
。我想尽可能有效地将这个名字分成名字和姓氏。我目前的方法是,
def splitName(name):
return pandas.Series(name.split()[0:2])
df[['first', 'last']] = df.apply(lambda x: splitName(x['name']), axis=1)
不幸的是,DataFrame.apply
真的,真的很慢。我能做些什么来使这个字符串操作几乎和操作一样快numpy
吗?
谢谢!