你真的把两个问题合二为一了。
我知道的最简单的解决方案是使用 pandas 包,但是我的文件是几个演出,我很难阅读它。所以我决定使用普通的流媒体方法。
不要那样做。与纯 Python 编写的任何东西相比,Pandas 可以用更少的内存和时间来处理大量数据。而且也不那么冗长。可以想象,numpy
在阅读后下降到然后对结果进行熊猫化会有所帮助,但下降到纯 Python 肯定会让事情变得更糟。
如果您的代码有问题,请向我们展示您的代码(以及生成等效示例数据的足够信息)。
在这里,我想动态生成列变量(列数约为 500),每个变量都将存储该特定列中的所有值,包括银行。例如:变量 a 将是一个列表 [11,22,31,,42,555]。
绝对不要那样做。你几乎不想像这样动态地生成变量。它没有任何好处,而且有很多缺点。
这正是字典的用途。而不是这个:
for column in columns:
create_variable_named(column[0]).set_to(column[1:])
只需这样做:
column_dict = {column[0]: column[1:] for column in columns}
然后你可以像这样访问它:
column_dict['a']
而且,如果你想遍历所有列,而不是这样:
for col in a, b, c, d, …, zz, aaa, …:
你可以这样做:
for col in column_dict.values():
如果您真的非常想创建动态变量,您可以。根据您要将它们添加到的范围或命名空间,它是以下之一:
globals()[name] = value
locals()[name] = value
setattr(module, name, value)
setattr(obj, name, value)
setattr(cls, name, value)
… 等等。