这个问题已经存在了一段时间,我想如果我能让它发挥作用,我应该提供一些奖励积分。
我做了什么……</h1>
最近在工作中,我编写了一个解析器,可以将二进制文件转换为可读格式。二进制文件不是带有10101010
字符的 Ascii 文件。它已被编码为二进制。因此,如果我cat
对文件执行操作,我会得到以下信息 -
[jaypal~/Temp/GTP]$ cat T20111017153052.NEW
==?sGTP?ղ?N????W????&Xx1?T?&Xx1?;
?d@#e?
?0H????????|?X?@@(?ղ??VtPOC01
cceE??k@9??W傇??R?K?i2??d@#e???&Xx1&Xx??!?
blackberrynet?/??!
??!
??#ripassword??W傅?W傆??0H??
#R??@Vtc@@(?ղ??n?POC01
所以我使用hexdump
实用程序使文件显示以下内容并将其重定向到文件。现在我有了我的输出文件,它是一个包含十六进制值的文本文件。
[jaypal~/Temp/GTP]$ hexdump -C T20111017153052.NEW
00000000 3d 3d 01 f8 73 47 54 50 02 f1 d5 b2 be 4e e4 d7 |==..sGTP.....N..|
00000010 00 01 01 00 01 80 00 cc 57 e5 82 00 00 00 00 00 |........W.......|
00000020 00 00 00 00 00 00 00 00 87 d3 f5 13 00 00 00 00 |................|
00000030 00 00 00 00 00 00 00 00 00 00 00 00 00 01 00 10 |................|
00000040 01 01 0f 00 00 00 00 00 26 58 78 31 00 b3 54 c5 |........&Xx1..T.|
00000050 26 58 78 31 00 b4 3b 0a 00 00 ad 64 13 40 01 03 |&Xx1..;....d.@..|
00000060 23 16 65 f3 01 01 0b 91 30 19 48 99 f2 ff ff ff |#.e.....0.H.....|
00000070 ff ff ff 02 00 7c 00 dc 01 58 00 a0 40 40 28 02 |.....|...X..@@(.|
00000080 f1 d5 b2 b8 ca 56 74 50 4f 43 30 31 00 00 00 00 |.....VtPOC01....|
00000090 00 04 0a 63 63 07 00 00 00 00 00 00 00 00 00 00 |...cc...........|
000000a0 00 00 00 65 45 00 00 b4 fb 6b 40 00 39 11 16 cd |...eE....k@.9...|
000000b0 cc 57 e5 82 87 d3 f5 52 85 a1 08 4b 00 a0 69 02 |.W.....R...K..i.|
000000c0 32 10 00 90 00 00 00 00 ad 64 00 00 02 13 40 01 |2........d....@.|
在大量awk
,sed
和之后cut
,脚本将十六进制值转换为可读文本。为此,我使用了偏移定位来标记每个转换参数的开始和结束位置。所有转换后的结果文件如下所示
[jaypal:~/Temp/GTP] cat textfile.txt
Beginning of DB Package Identifier: ==
Total Package Length: 508
Offset to Data Record Count field: 115
Data Source: GTP
Timestamp: 2011-10-25
Matching Site Processor ID: 1
DB Package format version: 1
DB Package Resolution Type: 0
DB Package Resolution Value: 1
DB Package Resolution Cause Value: 128
Transport Protocol: 0
SGSN IP Address: 220.206.129.47
GGSN IP Address: 202.4.210.51
我为什么这样做
我是一名测试工程师,手动验证二进制文件是一件很痛苦的事情。我必须手动解析偏移量并使用计算器转换它们并针对 Wireshark 和 GUI 进行验证。
现在是问题部分
我希望做与我所做的相反的事情。这是我的计划——
- 有一个易于阅读的输入文本文件,其中包含
Parameters : Values
. - 用户可以简单地将值放在它们旁边(例如,日期将是一个参数,用户可以给出他们希望数据文件具有的日期)。
- 该脚本将从输入文本文件中删除所有相关信息(用户提供的信息)并将它们转换为十六进制值。
- 将文件转换为十六进制值后,我希望将其编码回二进制。
前三步完成
问题
一旦我的脚本将输入文本文件转换为具有十六进制值的文本文件,我就会得到一个如下所示的文件(注意我可以这样做cat
)。
[visdba@hw-diam-test01 ParserDump]$ cat temp_file | sed 's/.\{32\}/&\n/g' | sed 's/../& /g'
3d 3d 01 fc 73 47 54 50 02 f1 d6 55 3c 9f 49 9c
00 01 01 00 01 80 00 dc ce 81 2f 00 00 00 00 00
00 00 00 00 00 00 00 00 ca 04 d2 33 00 00 00 00
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 10
01 01 0f 00 00 07 04 ea 00 00 ff ff 00 00 14 b7
00 00 ff ff 00 00 83 ec 00 00 83 62 54 14 59 00
60 38 34 f5 01 01 0b 58 62 70 11 60 f6 ff ff ff
ff ff ff 02 00 7c 00 d0 01 4c 00 b0 40 40 28 02
f1 d6 55 38 cb 2b 23 50 4f 43 30 31 00 00 00 00
00 04 0a 63 63 07 00 00 00 00 00 00 00 00 00 00
我的意图是将这个转换后的文件编码为二进制文件,这样当我cat
对文件进行处理时,我会得到一堆垃圾值。
[jaypal~/Temp/GTP]$ cat temp.file
==?sGTP?ղ?N????W????&Xx1?T?&Xx1?;
?d@#e?
?0H????????|?X?@@(?ղ??VtPOC01
cceE??k@9??W傇??R?K?i2??d@#e???&Xx1&Xx??!?
blackberrynet?/??!
??!
所以问题是这样的。我如何以这种形式对其进行编码?
我为什么要这样做?
我们在生产中没有很多 GTP(GPRS 隧道协议)消息。我想如果我对此进行逆向工程,我可以有效地创建一个数据生成器并制作我自己的数据。
总结一下
那里可能有复杂的工具,但我不想花太多时间学习它们。大约 2 个月了,我已经开始在 *nix 平台上工作,并且刚刚开始使用它的电动工具,比如sed
和awk
.
我想要的是一些帮助和指导来实现这一点。
再次感谢阅读!200 分等待能够引导我走向正确方向的人。:)
示例文件
这是原始二进制文件的示例
这是一个允许用户输入值的输入文本文件示例
这是我的脚本在输入文本文件的所有转换完成后创建的文件示例。
如何更改File 3
to的编码File 1
?