0

Listl包含由两种类型的列表组成的项目,第一种是由字符串组成的可接受列表,第二种由包含字符串的元组字符串组成。第二种类型的所有列表都具有相同的长度 - 2。我想将第二种类型的所有列表转换为与第一种类型相同的约定,如下所示(l2是更新的列表)。

编辑:我应该澄清我正在处理的实际列表不止两个项目,所以我需要一个循环函数来适应这个。

l = [["('N', '', 'SHOWERS', '', 'RD', '11734', '11734', '', '')", "('61060', '61060')"], ['', '', 'NORA', '', 'RD', '10301', '10999', '10400', '10998', '61089', '61089']]

l2 = [['N', '', 'SHOWERS', '', 'RD', '11734', '11734', '', '', '61060', '61060'], ['', '', 'NORA', '', 'RD', '10301', '10999', '10400', '10998', '61089', '61089']]

以下仅让我到目前为止:

from csv import reader
from cStringIO import StringIO

l2 = []

for i in l:
    if len(i) == 2:
        filestr = StringIO(i[0] + i[1])
        csv_reader = reader(filestr, quotechar="'")
        for t in csv_reader:
            l2.append(t)
    else:
        l2.append(i)
4

4 回答 4

2

您可以使用 ast:

>>> import ast
>>> l = [["('N', '', 'SHOWERS', '', 'RD', '11734', '11734', '', '')", "('61060', '61060')"], ['', '', 'NORA', '', 'RD', '10301', '10999', '10400', '10998', '61089', '61089']]
>>> l2=[e for e in ast.literal_eval(l[0][0])]
>>> l2+=[e for e in ast.literal_eval(l[0][1])]
>>> l2=[l2]
>>> l2.append(l[1])

>>> l2
[['N', '', 'SHOWERS', '', 'RD', '11734', '11734', '', '', '61060', '61060'], ['', '', 'NORA', '', 'RD', '10301', '10999', '10400', '10998', '61089', '61089']]

如您所知,eval存在一些真正的安全问题。ast非常安全,因为它只能生成 Python 基础数据结构。

于 2013-02-24T02:50:41.920 回答
1

且仅当您信任输入时,您可以评估它:

l2 = eval(l[0][0])

我不完全理解整个输入的结构,所以我无法帮助你遍历所有输入。

于 2013-02-24T02:44:13.303 回答
1

这不是 csv 问题,因为您没有 csv。(事实上​​,你让我困惑了一段时间,因为我试图想象 csv 文件的样子!)

  1. 建立一个列表是否需要标准化的“测试”(is_tuple_string_row下面的函数)。
  2. 用于ast.literal_eval安全地将元组字符串转换为实际元组。
  3. 用于chain.from_iterable将所有元组组合成一个序列。

下面的完整代码实现为生成器normalized_list()

l = [["('N', '', 'SHOWERS', '', 'RD', '11734', '11734', '', '')", "('61060', '61060')"], ['', '', 'NORA', '', 'RD', '10301', '10999', '10400', '10998', '61089', '61089']]

l2 = [['N', '', 'SHOWERS', '', 'RD', '11734', '11734', '', '', '61060', '61060'], ['', '', 'NORA', '', 'RD', '10301', '10999', '10400', '10998', '61089', '61089']]

import ast
from itertools import imap, chain


def is_tuple_string_row(L):
    """Return whether list L is a list of strings containing tuples"""
    return len(L)==2 and all(s.startswith("('") and s.endswith("')") for s in L)


def normalized_list(L):
    """Yield lists in sequence L as lists of strings

    Normalizes a list of strings of tuples down to a simple list of strings
    """
    for item in L:
        if is_tuple_string_row(item):
            yield list(chain.from_iterable(imap(ast.literal_eval, item)))
        else:
            yield item


# You can iterate efficiently
for item in normalized_list(l):
    print item

# or you can put the whole thing to a single new list
aslist = list(normalized_list(l))

# verify results
assert aslist == l2
于 2013-02-24T03:11:08.517 回答
0

我建议使用列表而不是元组,然后在必要时索引列表/子列表/和列表的子列表以实现您想要的。

另一个想法是制作一个你想要的结构的类。放置切片列表的方法。看来您希望元组中的前 9 个项目,以及单独的元组中的最后两个项目。这也是将它们分开的好方法。

于 2013-02-24T02:51:11.467 回答