6

我已经进行了一些搜索,但大多数答案是关于阅读完整的 csv 文件,而这些都不像我面临的问题。

我正在尝试使用 urllib2 从网络读取文件:

request = urllib2.Request('http://.../tv.txt')
response = urllib2.urlopen(request)
lines = response.readlines()
for line in lines:
    ...

“行”格式如下所示:

"ABC", "XYZ,MNO", "KLM"
"ABC", "MN"
"ABC", "123", "10", "OPPA GANGNAM STYLE", "LADY"

如上所示,这些行实际上不是 CSV 行。列数不断变化。

有没有办法将每一行分成一个列表?期望的结果应该是:

["ABC", "XYZ,MNO", "KLM"]
["ABC", "MN"]
["ABC", "123", "10", "OPPA GANGNAM STYLE", "LADY"]

我尝试使用 line.split(",") 但它无法正确拆分,因为每对双引号内都有逗号。

如果你知道怎么做,请帮助我。非常感谢你。

干杯,

PHP-Python-Java-MySQL-新手。

4

2 回答 2

8

使用 csv 模块,它可以满足您的需求。

yourstring= '"ABC", "XYZ,MNO", "KLM"\n"ABC", "MN"\n"ABC", "123", "10", "OPPA GANGNAM STYLE", "LADY"'

import csv
import io

class MyDialect(csv.Dialect):
    strict = True
    skipinitialspace = True
    quoting = csv.QUOTE_ALL
    delimiter = ','
    quotechar = '"'
    lineterminator = '\n'


b = io.StringIO(yourstring)
r = csv.reader(b, MyDialect())

for i in r:
    print len(i), ':',' @ '.join(i)
于 2013-02-21T10:12:39.783 回答
0
import csv
import io

input='''"ABC", "XYZ,MNO", "KLM"
"ABC", "MN"
"ABC", "123", "10", "OPPA GANGNAM STYLE", "LADY"'''

resader = csv.reader(
    io.StringIO(input), 
    delimiter = ',', 
    quotechar = '"', 
    skipinitialspace = True,
)
for row in resader:
    print(row)

将导致

['ABC', 'XYZ,MNO', 'KLM']
['ABC', 'MN']
['ABC', '123', '10', 'OPPA GANGNAM STYLE', 'LADY']
于 2019-01-31T10:29:41.990 回答