我有一个制表符分隔文件 ( raw.txt
),其格式如下:
type A1 A2 A3 A4 ....
params int char char char ...
data 1 abc cde fgh ...
type B1 B2 B3 B4 ....
feature int char char char ...
data 2 aaa bbb ccc ...
type C1 C2 C3 C4 ....
stats int int char char ...
data 2 11 aa bb ...
data 3 12 cc cc ...
data 4 13 dd dd ...
data 5 14 ee ee ...
... ... ... ... ... ...
我想解析这样的文件,然后我想创建一个以文件名命名的文件夹,然后在该文件夹中,我想基于types
. 一旦在该行中观察到,将使用数据创建文件type
,例如:
/raw/file1
A1 A2 A3 A4 ....
int char char char ...
1 abc cde fgh ...
/raw/file2
B1 B2 B3 B4 ....
int char char char ...
2 aaa bbb ccc ...
/raw/file3
C1 C2 C3 C4 ....
int int char char ...
2 11 aa bb ...
3 12 cc cc ...
4 13 dd dd ...
5 14 ee ee ...
... ... ... ... ...
等等......我也想创建字典,比如,
dict1 = {A1:['int', [1]], A2:['char', ['abc']], ...}
dict2 = {B1:['int', [2]], B2:['char', ['aaa']], ...}
dict3 = {C1:['int', [2, 3, 4, 5], C2:['int', [11, 12, 13, 14, ...]], ...}
我该怎么做,因为这是一个非常大的文件,解析如此大的文件会挂起窗口,而且我无法弄清楚如何从文件中获取这样的输出。