0

我有这样的文字:

text = ["A/abc","B/abd","C/abc","D/xyz"]

我想要的输出是

 mylist1 = ["A","C"]
 mylist2 = ["B"]
 mylist3 = ["D"]

我正在寻找的唯一标签是“/abc”和“/abd”

现在我拥有的是:

def searchWord(segment):
    word_tag = segment.split('/')

    if re.finditer('ab',word_tag[1]):
        if re.finditer('abc',word_tag[1]):
            letter = word_tag[0]
            mylist1 = letter
        else:
            letter = word_tag[0]
            mylist2 = letter
    else:
        letter = word_tag[0]
        mylist3 = letter

    return mylist1
    return mylist2
    return mylist3

mylist1,mylist2,mylist3 = [searchWord(segment) for segment in text]

它似乎工作正常,但抛出异常:

 ValueError: too many values to unpack.

我的“文本”列表相当大,这可能是问题吗?在为此过程构建功能之前,我没有这个问题。

谢谢!

4

3 回答 3

5

将您的列表作为元组返回:

return mylist1, mylist2, mylist3

Python 不会执行所有三个return语句,只执行第一个语句。

如果您尝试将项目分类为不同的类别,您通常会使用字典:

buckets = {'abc': [], 'abd': [], 'xyz': []}
for segment in text:
    item, tag = segment.split('/', 1)
    buckets[tag].append(item)

然后您仍然可以将这三个列表提取到 3 个变量中,但您也可以直接引用存储桶。例如mylist1,您将参考代替。buckets['abc']

于 2013-10-08T12:55:59.610 回答
1

你的问题

您确实应该包含完整的堆栈跟踪,但在这种情况下很容易推断出mylist1,mylist2,mylist3 = [searchWord(segment) for segment in text]是有问题的行,因为列表理解返回超过 3 个值,您不能将它们仅分配给 3 个变量。但是你的代码中的问题是你return不止一次地尝试。

return mylist1
return mylist2
return mylist3

一个函数只能有 1 个返回值,因此您应该将其更改为:

return (mylist1, mylist2, mylist3)

一个解法

在查看您的代码并看到您的愿望之后。我为你修好了:

def catagorize(data):
    container = [[],[],[]]
    for segment in data:
        searchWord(segment, container)
    return container

def searchWord(segment, container):
    letter, tag = segment.split('/')
    if tag == 'abc':
        container[0].append(letter)
    elif tag == 'abd':
        container[1].append(letter)
    elif tag == 'xyz':
        container[2].append(letter)
    else:
        raise ValueError('unknown tag')

运行代码:

>>> text = ["A/abc","B/abd","C/abc","D/xyz"]
>>> mylist1, mylist2, mylist3 = catagorize(text)
>>> print mylist1, mylist2, mylist3 
['A', 'C'] ['B'] ['D']

另一种解决方案

一个更强大的解决方案:

from collections import defaultdict

def catagorize(data):
    container = defaultdict(list)
    for letter, tag in (segment.split('/') for segment in data):
        container[tag].append(letter)
    return container

在行动:

>>> catagorize(["A/abc","B/abd","C/abc","D/xyz"])
defaultdict(<type 'list'>, {'xyz': ['D'], 'abc': ['A', 'C'], 'abd': ['B']})
于 2013-10-08T12:57:32.287 回答
0

只有第一个return被执行。return返回一个答案并将控制权返回给调用者。之后的任何回报都不会运行。

因此,您不会按预期返回三项,而只返回 mylist 的内容(显然不是三项列表)。

你想要什么:

return (mylist1, mylist2, mylist3)
于 2013-10-08T12:57:33.150 回答