1

拥有一个包含大约 50 列和几行的逗号分隔文件,我需要删除所有始终为 0 的列(即该列中的所有值都为零)。

使用以下代码读取该文件:

with open('data.txt', 'rb') as f:
    reader.csv.reader(f, delimiter=',')
    for row in reader:
        print row


0 0.1 0.3 0.4 0
0 0.2 0.5 0.3 0
0 0.7 0.9 0.2 0

如何从这个内存结构中准确地删除列(即 0)。如果没有重写和重新读取另一个临时 csv 文件来实现这一点,那就更好了。

4

1 回答 1

1

读取所有行(将所有值映射到浮点数),使用 转换为列zip(*rows),使用 仅保留任何具有非零值any()的行,使用 转换回行zip(*columns)

with open('data.txt', 'rb') as f:
    rows = list(map(float, row) for row in csv.reader(f, delimiter=','))

rows = zip(*[col for col in zip(*rows) if any(col)])

后一步作为演示:

>>> rows = [[0, 0.1, 0.3, 0.4, 0], [0, 0.2, 0.5, 0.3, 0], [0, 0.7, 0.9, 0.2, 0]]
>>> zip(*[col for col in zip(*rows) if any(col)])
[(0.1, 0.3, 0.4), (0.2, 0.5, 0.3), (0.7, 0.9, 0.2)]
于 2013-03-25T15:17:51.880 回答