python - Python 在另一个 csv 列表中过滤逗号分隔的列表

Question

我有两个字符串：

s1 = "Brendon, Melissa, Jason, , McGuirk" #the gauranteed string in format "x, y, z"
s2 = "brandon,melissa,jxz  ,paula,coach" #the messy string

并想创建一个 Python (2.7) 列表，如果 l1 中的值存在，则使用它，否则传递 l2 中的值。我有工作代码，但即使有列表推导，我觉得可能有一种更 Pythonic 的方式来做到这一点。任何想法可能是什么？

l1 = [x.strip() for x in s1.split(',')]
l2 = [x.strip() for x in s2.split(',')]
f = lambda s: s[1] if s[1] else s[0]
final = [f(x) for x in zip(l2, l1)]

“最终”列表现在包含：

['Brendon', 'Melissa', 'Jason', 'paula', 'McGuirk']

哪个是对的。

-------- 编辑所以，看看下面乔恩的答案，a 或 b 似乎是最简单、最易读的方法。我将字符串清理移到了一个小函数中，最后得到了这个。有什么进一步的改进吗？

trim_csv = lambda csv: [s.strip() for s in csv.split(',')]
print [a or b for a, b in zip(trim_csv(s1), trim_csv(s2))]

score 6 · Accepted Answer

适用于您的示例

s1 = "Brendon, Melissa, Jason, , McGuirk"
s2 = "brandon, melissa, jxz, paula, coach"

print [a or b for a, b in zip(s1.split(', '), s2.split(', '))]

可以适应的更通用的一种：

import re
from itertools import izip_longest, ifilter, imap

s1 = "Brendon, Melissa, Jason, , McGuirk"
s2 = "brandon, melissa, jxz, paula, coach"


def take_first_not_empty(*args):
    splitter = re.compile(r'\s*?,\s*').split
    words = imap(splitter, args)
    return [next(ifilter(None, vals), '') for vals in izip_longest(*words, fillvalue='')]

score 2 · Accepted Answer

像这样的东西？

>>> s1 = "Brendon, Melissa, Jason, , McGuirk"
>>> s2 = "brandon, melissa, jxz, paula, coach"
>>> [x if x else y  for x,y in zip( s1.split(', '),s2.split(', '))]
['Brendon', 'Melissa', 'Jason', 'paula', 'McGuirk']

python - Python 在另一个 csv 列表中过滤逗号分隔的列表

2 回答 2

Related

Reference