什么是删除文件中空列的最快方法。下面给出了一个示例文件。
我使用了 python 'pandas' 包,但是加载我的 2 GB 文件需要太多时间(大约 10 分钟后我没有得到答案,所以退出,因为我必须对许多文件执行此操作)。
df = read_table(inFileName, sep="\t")
df = df.dropna(axis=1,how='all') #remove columns
aaa bbb ccc ddd eee
1 a c
2 s d
3 d
f d
4 g d
5 h e
我事先不知道哪些字段是空的。我正在使用 0.9.1 版本的“熊猫”
pkg_resources.get_distribution("pandas").version '0.9.1'