我有一个包含名字和姓氏的列表,如下所示:
names = ["John Smith", "Rob Julian", "Eric Walls"]
我只想获取此列表中的名字。
我通过这样做实现了这一点:
first_names = [n.split(" ")[0] for n in names]
这给了我想要的结果。
但在我看来这很丑陋,有没有更好的方法来实现这个目标?
我有一个包含名字和姓氏的列表,如下所示:
names = ["John Smith", "Rob Julian", "Eric Walls"]
我只想获取此列表中的名字。
我通过这样做实现了这一点:
first_names = [n.split(" ")[0] for n in names]
这给了我想要的结果。
但在我看来这很丑陋,有没有更好的方法来实现这个目标?
是的,但不是真的。性能方面,你最好用你所拥有的。
first_names = []
for n in names:
first_names.append(n.split()[0])
会工作,但我喜欢python中的列表理解。我的意思是有什么问题
first_names = [n.split()[0] for n in names]
为了好玩,您还可以执行以下操作。我想如果你正在处理一个非常大的列表,这可能会有最好的性能。但是,您可能想先调查一下。
first = lambda n : n.split()[0]
first_names = [first(name) for name in names]
为了使其全面,您还可以使用 lambda 对其进行映射。
first = lambda n : n.split()[0]
first_names = map(first,names)
根据评论,我正在添加另一种方式
from operator import itemgetter
first_names = map(itemgetter(0), map(str.split, names))
但您的原件似乎是最受欢迎的。如果速度是一个问题,您可能需要修补其他问题。
不是最科学的,但是使用大约 350 万个名称的列表,我运行上面调用文件 n0-4 并运行time n0;time n1; time n2; time n3; time n4
这里是我的结果。看起来好像原始列表理解是我机器上最快的。
real 0m8.433s
user 0m7.064s
sys 0m1.288s
real 0m8.213s
user 0m6.852s
sys 0m1.300s
real 0m8.581s
user 0m7.240s
sys 0m1.264s
real 0m8.374s
user 0m7.164s
sys 0m1.140s
real 0m11.890s
user 0m10.101s
sys 0m1.672s
(我以不同的顺序运行了几次,时间是一致的。)
我认为最好的性能是使用匿名函数和map
函数:
first = lambda n : n.split()[0]
first_names = map(first,names)
我不会说它更好,但这是另一种方法:
>>> names = ["John Smith", "Rob Julian", "Eric Walls"]
>>> first = lambda x:x.split()[0]
>>> map(first, names)
['John', 'Rob', 'Eric']