1

我是 Python 新手,我有一个解决方案,但它看起来很慢而且很愚蠢,所以我想知道是否有更好的方法?

假设我有一个这样定义的矩阵:

mat = [['hello']*4 for x in xrange(3)]

我正在使用此函数将其写入文件:

def writeMat(mat, outfile):
  with open(outfile, "w") as f:
    for item in mat:
      f.writelines(str(item).replace('[','').replace(',','').replace('\'','').replace(']','\n'))

writeMat(mat, "temp.txt")

这给出了一个如下所示的文本文件:

hello hello hello hello
hello hello hello hello
hello hello hello hello

我正在处理的文件非常大。numpy 中的savetxt函数会很棒,但我不想将其存储为 numpy 数组,因为虽然矩阵的大部分由单个字符元素组成,但前几列的长度将是许多字符,而且它似乎我(如果我错了,请纠正我)这意味着整个矩阵将使用比必要更多的内存,因为矩阵中的每个元素都是最大元素的大小。

4

2 回答 2

2

如果我正确理解你的问题,你可以这样做:

f.writelines(' '.join(row) + '\n' for row in mat)

或者

f.write('\n'.join(' '.join(row) for row in mat))

第一个具有作为生成器表达式的优点,它只生成当前行的串联字符串副本

如果您的矩阵条目不是字符串,您可以这样做:

f.writelines(' '.join(str(elem) for elem in row) + '\n' for row in mat)

编辑

file.writelines()方法似乎在将整个生成器表达式写入文件之前对其进行评估。因此,以下内容将最大限度地减少您的内存消耗:

for row in mat:
    f.write(' '.join(row) + '\n')
于 2012-07-21T05:10:15.513 回答
1

您可以使用csv 模块

import csv

with open(outfile, 'wb') as f:
     csv.writer(f, delimiter=' ').writerows(mat)
于 2012-07-21T05:30:40.003 回答