我很难将大型(50GB)csv 文件分成更小的部分。每行有几千个字段。一些字段是双引号中的字符串,其他字段是整数、小数和布尔值。
我想逐行解析文件并按每行中的字段数分割。字符串可能包含几个逗号(例如 ),以及一些空字段。
,,1,30,50,"父子三女以 4,000 美元出售" ,,,,, 12,,,20.9,0,
我尝试使用
perl -pe' s{("[^"]+")}{($x=$1)=~tr/,/|/;$x}ge ' file >> file2
将引号内的逗号更改为 | 但这没有用。我打算用
awk -F"|" conditional statement appending to new k_fld_files file2
请问有没有更简单的方法来做到这一点?我在看python,但我可能需要一个实用程序来逐行处理文件。