我有一个带有 n 列(~30000)、~2000 行和列名的大数据框(df)X,如下所示:
A,B,C,D,F,G,H,v1,453,73v,4-5,ss,9-dd,...,n
X 的元素是整数、浮点数和字符串的混合。
使用 python 或 unix/bash,我想将 X 拆分为 n-7 dfs。每个生成的 df 将保留 X 的前 7 列 + X 的下一个单列。因此,前 3 个 df 将具有以下列:
A,B,C,D,F,G,H,v1
A,B,C,D,F,G,H,453
A,B,C,D,F,G,H,73v
等等...
我希望每个生成的 dfs 保留其最后一列的名称 +“.txt”。因此,前三个 df 将被称为“v1.txt”、“453.txt”和“73v.txt”。
这篇文章有点类似于:将 大文件拆分为 n 个文件,保留前 7 列 + 后 3 列,直到第 n 列
但我无法适应它。