我有两个巨大的文本文件(大小从 1 到 5 GB),我必须使用 shell 命令计算它们之间的差异。问题是,对于这些文件的每一行,我必须忽略特定位置的一些字符。
第一次我使用差异,从两个文件中删除我必须忽略的内容:
差异 <(cut -b1-58,69- FILE1.TXT) <(cut -b1-58,69- FILE2.TXT) > OUTPUT.TXT;
但问题是输出文件不包含剪切字符。
例子
文件1:
0123456311020130123456
啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊
bbbbbbb31102013bbbbbbb
文件2:
0123456310920130123456
1111111310920131111111
aaaaaaB31092013aaaaaaB
bbbbbbb31092013bbbbbbb
diff 必须忽略每行 8 到 15 的字符,在输出中也返回新行:
输出:
1111111310920131111111
aaaaaaB31092013aaaaaaB
有谁能够帮我?
非常感谢,弗朗切斯科