7

我正在尝试将整个文件提取到内存中(完成 - 使用 StringIO) - 但据我所知,这些对象的行为并不完全像“真实”文件 - 我得到了全部内容,或者我可以读取一次一行,但我不知道如何应用这种模式:

import csv 
with open(#MYMEMORYFILE_HERE#, 'rb') as csvfile:
        spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
        for row in spamreader:

有没有办法像磁盘文件一样处理内存文件,所以我可以使用上面更好的成语?

Python 2.7.4 (default, Apr 19 2013, 18:28:01) 

编辑:感谢您对此的回答 - 我想我已经缩小了让我感到困惑的范围......但我在这里仍然有一个问题,以下没有输出任何东西?我怀疑潮红?

from csv import reader, writer
import StringIO

memfile=StringIO.StringIO()
spamwriter = writer(memfile)
spamwriter.writerow(['Spam'] * 5 + ['Baked Beans'])
spamwriter.writerow(['Spam', 'Lovely Spam', 'Wonderful Spam'])
spamreader=reader(memfile)
for row in spamreader:
        print ', '.join(row)
memfile.close()

编辑#2:但是我在吠叫错误的树,我认为:我也无法让磁盘上的版本工作('IOError:文件未打开以供读取'-当我在已经调用读取时打开文件...) EDIT#3:放弃了 StringIO (不需要它) - 根据答案使用分割线。

我将把代码和注释留在这里——以防万一有用。(即使它是一个死胡同)。

4

2 回答 2

13

如果要将整个文件读入内存,并且它是文本,则不需要打开 StringIO 对象。只需将其作为字符串读取!

with open(filename, 'r') as file:
    in_memory_file = file.read()

然后,您可以splitlines像迭代打开的文本文件一样使用它来迭代它。

spamreader = csv.reader(in_memory_file.splitlines(), delimiter=' ', quotechar='|')
for row in spamreader:
    pass
于 2013-07-20T22:47:18.923 回答
6

不需要打开StringIO对象,它已经是一个打开的文件对象:

spamreader = csv.reader(MYMEMORYFILE_HERE, delimiter=' ', quotechar='|')

csv.reader()需要的只是一个可迭代的对象。一个StringIO对象符合这个要求。

演示:

>>> from StringIO import StringIO
>>> data = StringIO('1,2,3\n4,5,6\n')
>>> import csv
>>> for row in csv.reader(data):
...     print row
... 
['1', '2', '3']
['4', '5', '6']

至于你自己的StringIO.StringIO测试;你写了一个文件对象,但忽略了寻找开始;由于文件指针仍在末尾,因此不会读取任何数据。回溯:

memfile.seek(0)
spamreader=reader(memfile)
于 2013-07-20T22:42:21.967 回答