2

我有一个从 NLTK 树中提取的这样的值。


[[('Happy', 'NNP'), ('Mother', 'NNP')], [('Day', 'NNP')], [('Joey', 'NNP'), ('M.', 'NNP'), ('Bing', 'NNP')], [('kind', 'NN')], [('happy', 'JJ'), ('wife', 'NN')], [('mother', 'NN')], [('friend', 'NN')]]


我希望最终结果是

['Happy Mother','Day','Joey M. Bing','kind','happy wife','mother','friend']

我如何以python方式做到这一点?

这是我到目前为止所做的,我知道这很丑陋。我是蟒蛇处女。


Y = []
for x in X:
    s = ""
    for z in x:
        s += z[0] + " "
    Y.append(s)

print Y

4

3 回答 3

4

zip使用和可以很容易地做到这一点str.join

result = [' '.join(zip(*row)[0]) for row in data]

zip(*sequences)[i]是一个常见的 Python 习惯用法,用于从每个序列(列表、元组等)中获取第 i 个值

它类似于[seq[i] for seq in sequences]但即使序列不可下标(例如迭代器)也可以工作。在 Cpython 中,由于使用了内置函数,它可能会稍微快一些(尽管如果它很重要,您应该始终对其进行分析)。此外,它返回一个元组而不是一个列表。

有关详细信息,请参阅文档

于 2013-03-12T23:06:00.550 回答
3
Y = [' '.join(t[0] for t in l) for l in X]
于 2013-03-12T23:06:23.723 回答
1

使用列表推导:

>>> X = [[('Happy', 'NNP'), ('Mother', 'NNP')], [('Day', 'NNP')], [('Joey', 'NNP'), ('M.', 'NNP'), ('Bing', 'NNP')], [('kind', 'NN')], [('happy', 'JJ'), ('wife', 'NN')], [('mother', 'NN')], [('friend', 'NN')]]
>>> Y = [' '.join(z[0] for z in x) for x in X]
>>> Y
['Happy Mother', 'Day', 'Joey M. Bing', 'kind', 'happy wife', 'mother', 'friend']
于 2013-03-12T23:05:42.247 回答