0

我有一个大的 .dat 文件(3gigs),其中包含用空格分隔的值。这是第一行的样子:

  S       201001        7            2                2                             30105                                            2  011    06   1  123                         3405   1   06  01           2    2                                      0321          1006  314           2000                                     2   222                   2 2               2     2  2          122222 11      3    094     1            M 04  200940   39072       3941    083                              22       2    2  2 2                                             110 110 00   0000000    00      000000000 000000  000      000000000000000000011                  101              1   111            1 0      1     1  1        111111                11       1    1  1 1    

我有一个备忘单,其中提到了列名和它们的值的位置。例如:姓名 15-18、年龄 55-56 等。

所以,我是 python 的新手,我的问题是如何使用 python 解析这个大型数据集并将其保存到一个 CSV 文件中,顶部是列名,下面是值。

谢谢。

4

1 回答 1

0

I would advise you against doing it in Python. I needed to perform similar operations for a migration and I eventually ran Sed from my Python scripts. I can assure you that investing a little time learning how to use Sed will pay off. http://www.grymoire.com/Unix/Sed.html If you are on Unix it's probably already there, if you are on Windows, you can get Cygwin.

于 2013-04-16T00:19:50.833 回答