我有一个非常大的文本文件,其中包含以下数据行:
('#DownWithAssad', '1')
('#DownYoTLParty', '1')
('#Download', '8')
('#Download:', '2')
('#Downloads', '2')
('#DownstairsMixtape', '1')
('#DowntonAbbey', '12')
('#DowntonAbbey?', '1')
('#DowntonPBS', '23')
('#Downtonabbey', '1')
('#DowntownAbbey', '1')
这似乎是一个简单的问题,但我想将数据从最高到最低软化,所以它看起来像:
('#DowntonPBS', '23')
('#DowntonAbbey', '12')
('#Download', '8')
('#Download:', '2')
('#Downloads', '2')
('#DownstairsMixtape', '1')
('#DownWithAssad', '1')
('#DownYoTLParty', '1')
('#DowntonAbbey?', '1')
('#Downtonabbey', '1')
('#DowntownAbbey', '1')
我认为我可以消除括号 () 并将数据拆分为:
import sys
f = open(sys.argv[1])
for line in f:
line = str(line)[1 : -1]
for sect in line.split(','):
print sect
但是我不确定从这里去哪里。