我有一些 2k 文件要逐块比较,但这些块的标识不同。将每个文件拆分为适当的块列表然后将每个块类型与相同的块类型进行比较的最佳方法是什么?
块类型:
- HL*
- EB*
- 东南*
- 通用电气*
- 国际能源署*
文件示例 - 我添加了空格以提高可读性,但文件没有空格。
useless-Text-useless-Text-~
useless-Text-useless-Text-useless-Text-~
HL*Block1'HL'text-Block1'HL'text-Block1'HL'text-Block1'HL'text-~
Block1'HL'text-Block1'HL'text-~
HL*Block2'HL'text-Block2'HL'text-~
Block2'HL'text-Block2'HL'text-~
HL*Block3'HL'text-Block3'HL'text-Block3'HL'text-~
Block3'HL'text-~
EB*Block1'EB'Text-Block1'EB'Text-Block1'EB'Text-~
Block1'EB'Text-Block1'EB'Text-~
Block1'EB'Text-Block1'EB'Text-~
EB*Block2'EB'Text-Block2'EB'Text-Block2'EB'Text-~
Block2'EB'Text-Block2'EB'Text-~
Block2'EB'Text-Block2'EB'Text-~
EB*Block3'EB'Text-Block3'EB'Text-Block3'EB'Text-~
Block3'EB'Text-Block3'EB'Text-~
Block3'EB'Text-Block3'EB'Text-~
EB*Block4'EB'Text-Block4'EB'Text-Block4'EB'Text-~
Block4'EB'Text-Block4'EB'Text-~
Block4'EB'Text-Block4'EB'Text-~
EB*Block_N'EB'Text-Block_N'EB'Text-Block_N'EB'Text-~
Block_N'EB'Text-Block_N'EB'Text-~
Block_N'EB'Text-Block_N'EB'Text-~
SE*Block1'SE'Text-Block1'SE'Text-~
Block1'SE'Text-~
GE*Block1'GE'Text-~
IEA*Block1'IEA'Text-~