我有一个文件,我试图从中提取信息,该文件中包含信息,并且是逐行格式,信息用逗号分隔。
我想把它放在一个列表中,或者尽我所能从特定索引中提取信息。该文件很大,有超过 1000000000 行,我必须在每一行中提取相同的索引才能获得相同的信息。这些是我想要从文件中获取的哈希值,所以我想知道如何根据长度找到所有出现的哈希值。
import os
os.chdir('C:\HashFiles')
f = open('Part1.txt','r')
file_contents=f.readlines()
def linesA():
for line in file_contents:
lista = line.split(',')
print linesA()
这就是我到目前为止所拥有的一切,这只是将所有内容放在一个我可以索引的列表中,但我想将这些索引中的数据输出到另一个文件,但由于 for 语句我无法做到,我该如何解决这?
哇你们太棒了,现在我有一个问题,因为在存储此信息的文件中,它以提供信息的赞助商的信息开头,我如何绕过这些行从另一行开始,因为我需要的行从文件中大约有 100 行,以帮助我,因为目前我遇到索引错误并且无法弄清楚如何设置条件来应对它。我尝试了这种情况但没有用:如果 line[:] != 15: continue
可使用的最新代码:
导入 csv
with open('c:/HashFiles/search_engine_primary.sql') as inf, open('c:/HashFiles/hashes.txt','w') as outf:
for i in xrange(47):
inf.next() # skip a line
for line in inf:
data = line.split(',')
if str(line[0]) == 'GO':
continue
hash = data[15]
outf.write(hash + '\n')