0

我有一条线(来自 csv),如下所示:

line = 'M1,After.Life,Agnieszka Wojtowicz-Vosloo,Agnieszka Wojtowicz-Vosloo,"Drama, Thriller",2009/10/2/,80'

当我这样做时,print line.split(',')我得到:

['M1', 'After.Life', 'Agnieszka Wojtowicz-Vosloo', 'Agnieszka Wojtowicz-Vosloo', '"Drama', ' Thriller"', '2009/10/2/', '80']

这是不可取的,因为它也分裂了“戏剧,惊悚片”。换句话说,我想要的结果是:

['M1', 'After.Life', 'Agnieszka Wojtowicz-Vosloo', 'Agnieszka Wojtowicz-Vosloo', '"Drama Thriller"', '2009/10/2/', '80']

对简单方法有任何想法吗?谢谢

4

1 回答 1

7

您改为使用该csv模块。您有 CSV 格式,并且该模块知道如何正确处理引用的值。

import csv

with open(somefilename, 'rb') as inputfile:
    reader = csv.reader(inputfile)
    for row in reader:
        # row is a list of string values found on each line, ready split, 
        # with qouted values preserved.

您的示例行的快速演示:

>>> import csv
>>> inputfile=['M1,After.Life,Agnieszka Wojtowicz-Vosloo,Agnieszka Wojtowicz-Vosloo,"Drama, Thriller",2009/10/2/,80\n']
>>> list(csv.reader(inputfile))
[['M1', 'After.Life', 'Agnieszka Wojtowicz-Vosloo', 'Agnieszka Wojtowicz-Vosloo', 'Drama, Thriller', '2009/10/2/', '80']]

请注意,引号已被删除,但逗号仍作为值的一部分存在。

于 2013-04-21T08:54:32.143 回答