1

我正在尝试解析文本文件中的项目并将它们存储到列表中。数据看起来像这样:

[(0, 0, 0), (1, 0, 0), (2, 0, 0), (3, 0, 0), (4, 0, 0), (5, 0, 0), (6, 0, 0)]
[(10, 3, 1), (11, 3, 1), (12, 3, 1), (13, 3, 1), (13, 4, 1)]
[(10, 3, 5), (11, 3, 5), (12, 3, 5), (13, 3, 5), (13, 4, 5), (13, 5, 5), (13, 6, 5)]
[(6, 13, 5), (7, 13, 5), (8, 13, 5), (8, 14, 5), (7, 14, 5), (6, 14, 5), (6, 14, 6)]

我能够剥离“[”和“]”,但无法将其余信息以如下格式存储到列表中:(x, y, z)。有什么帮助吗?

 def dataParser(fileName):
    zoneList=[]; zone=[]
    input=open(fileName,"r")

    for line in input:
        vals = line.strip("[")
        newVals = vals.strip("]\n")

        print newVals
        v=newVals[0:9]
        zone.append(v)

    input.close()
    return zone
4

5 回答 5

6

在这种特殊情况下,您可以使用ast.literal_eval

>>> with open("list.txt") as fp:
...     data = [ast.literal_eval(line) for line in fp if line.strip()]
... 
>>> data
[[(0, 0, 0), (1, 0, 0), (2, 0, 0), (3, 0, 0), (4, 0, 0), (5, 0, 0), (6, 0, 0)], [(10, 3, 1), (11, 3, 1), (12, 3, 1), (13, 3, 1), (13, 4, 1)], [(10, 3, 5), (11, 3, 5), (12, 3, 5), (13, 3, 5), (13, 4, 5), (13, 5, 5), (13, 6, 5)], [(6, 13, 5), (7, 13, 5), (8, 13, 5), (8, 14, 5), (7, 14, 5), (6, 14, 5), (6, 14, 6)]]

这是“安全”版本的eval. 但是,正是出于这个原因,它并不那么普遍。如果您正在生成此输入,您可能希望研究一种不同的方式来保存您的数据(“序列化”),无论是使用pickle还是类似的方式JSON- 您可以在 SO 和其他地方找到很多使用这两种方式的示例。

于 2012-09-06T21:14:23.710 回答
3

您可以使用字符串拆分方法和元组构造函数在没有 eval 的情况下执行此操作:

>>> st = "[(0,0,0), (1,0,0)]"
>>> splits = st.strip('[').strip(']\n').split(', ')
>>> splits
['(0,0,0)', '(1,0,0)']
>>> for split in splits:
...   trimmed = split.strip('(').strip(')')
...   tup = tuple(trimmed.split(','))
...   print tup, type(tup)
...
('0', '0', '0') <type 'tuple'>
('1', '0', '0') <type 'tuple'>
>>>

从那里,它只是附加到一个列表中。

于 2012-09-06T21:34:20.713 回答
2

有些人可能不喜欢eval()在这里使用,但您可以使用它在一行中执行此操作:

In [20]: lis=eval("[(0, 0, 0), (1, 0, 0), (2, 0, 0), (3, 0, 0), (4, 0, 0), (5, 0, 0), (6, 0, 0)]")
In [23]: lis
Out[23]: [(0, 0, 0), (1, 0, 0), (2, 0, 0), (3, 0, 0), (4, 0, 0), (5, 0, 0), (6, 0, 0)]

使用文本文件:

In [44]: with open('data.txt') as f:
   ....:     lis=[eval(x.strip()) for x in f]
   ....:     print lis
   ....:     
   ....:     
[[(0, 0, 0), (1, 0, 0), (2, 0, 0), (3, 0, 0), (4, 0, 0), (5, 0, 0), (6, 0, 0)], [(10, 3, 1), (11, 3, 1), (12, 3, 1), (13, 3, 1), (13, 4, 1)], [(10, 3, 5), (11, 3, 5), (12, 3, 5), (13, 3, 5), (13, 4, 5), (13, 5, 5), (13, 6, 5)], [(6, 13, 5), (7, 13, 5), (8, 13, 5), (8, 14, 5), (7, 14, 5), (6, 14, 5), (6, 14, 6)]]
于 2012-09-06T21:13:52.937 回答
0

如果您从任何您不完全信任的来源获取此数据,则以下是一个坏主意,但如果数据始终采用这种格式(并且仅包含数字作为元素),则类似这样的事情非常简单:

collect = []
for line in input:
    collect.append(eval(line))
于 2012-09-06T21:14:24.243 回答
0

其他答案工作得很好,是这个特定问题的简单解决方案。但我假设如果您在字符串操作方面遇到问题,那么下次遇到此问题时,一个简单的 eval() 函数不会对您有太大帮助。

作为一般规则,当您遇到此类问题时,您要做的第一件事就是定义分隔符。

[(0, 0, 0), (1, 0, 0), (2, 0, 0), (3, 0, 0), (4, 0, 0), (5, 0, 0), (6, 0, 0)]

在这里您可以看到“),(”是组之间的潜在分隔符,简单的逗号(“,”)是值之间的分隔符。接下来您想查看需要删除的内容,正如您所指出的,括号 ( "[""]" ) 提供的信息很少。我们还可以看到,因为我们处理的是数值,所以所有的空格给我们的信息很少,需要删除。

在此信息的基础上,我以返回您正在寻找的值的方式设置了您的dataParser函数:

fileName= "../ZoneFinding/outputData/zoneFinding_tofu_rs1000.txt"

def dataParser(fileName):
    with open(fileName,"r") as input
        zoneLst = []
        for line in input:
            #First remove white space and the bracket+parenthese combos on the end
            line = line.replace(" ","").replace("[(","").replace(")]","")

            #Now lets split line by "),(" to create a list of strings with the values
            lineLst = line.split("),(")

            # At this point lineLst = ["0,0,0" , "1,0,0", "2,0,0", ...]
            #Lastly, we will split each number by a "," and add each to a list
            zone = [group.split(",") for group in lineLst]

            zoneLst.append(zone)

        return zoneLst

在上面的示例中,所有值都存储为字符串。您还可以用下面的代码替换区域的定义,以将值存储为浮点数。

zone = [ [float(val) for val in group.split(",")] for group in lineLst]
于 2012-09-06T22:23:03.253 回答