2

我在使用 grep 正则表达式时遇到了一些问题。我正在尝试 grep 一些 ascii 编码的十六进制数据,其中字符都是小写的

我的 grep 语句如下:

grep -E "01[a-f0-9]{2}81[a-f0-9]0" log.log

文件中的大多数匹配看起来都不错,除了有很多匹配如下

010481ec070000
01b481ec070000
01508129070521

我无法弄清楚为什么这些字符串匹配。它们不应该匹配,因为 81 必须后跟一个十六进制字符,然后是一个零。

我做了一些进一步的调查。如果我将这三个字符串放在一个单独的文件中,然后 grep 该文件。我没有匹配。不太清楚这里发生了什么。

这是 grep 2.12。

这是文件中原始数据的一部分。这些都是匹配的行。并且在导出 LC_ALL=C 后仍然匹配

input data : 011a81a907000b3002004070eaa3d2240fa81272011763dd0040002001
input data : 010481e1070000
input data : 010481ea070000
input data : 011a81a207000b980f0040681f2b11d2f60202dc003669ba0140006100
input data : 014681ab07002140010040d2e457f8c00494ed5e014362bf0240006101ae0500404ee311f402feb2165401c562450240005801db08044068f09ff6a6005af953008062470640004d01
input data : 010481e3070000
input data : 013081ac070016c0000040f6d963fcb4f7e8127c0103637b0140006f01bf0200408ae344fdd2043eed72018362a30240006f01
input data : 010481e4070000
input data : 011a81ad07000b5c06006064f96804901154fed2008e66ff0f4000a401
input data : 010481e5070000
input data : 014681ae070021170d004069f196134cf6a805b4000769b6034000be014e0e004092e80820da0b82fbfa000c6c5c014000bf01880a004020d9ce21f4efd40954011469a1004000ae01
input data : 011a81a607000bef0d0060d60dd6edf8f18e104e015b63d3014000da00
input data : 011a81af07000b4c0800401cfbb0184a0c28f7fa00516931024000e101
input data : 015c81a007002c12050020f2ff640028007afd00801205f70540000400280c00404f016a0a10fbd0012a00e769ff0f400018005d020040e3fabd21e00830f4d200c769d80140000300030a004042030
4

2 回答 2

0

尝试使用环境变量执行它LC_ALL=C。语言环境会影响grep解释字符范围的方式。

于 2013-10-01T22:59:37.623 回答
0

假设该命令与您所说的完全一样...引号是正确的,在 grep 获取参数之前没有文件名 glob,您没有 {0} 而不是 0,等等....

我想知道 -a (将二进制文件视为文本)是否是罪魁祸首。二进制输出可以由终端处理。(这就是我们改变颜色或做诅咒定位或诸如此类的方式。)

如果你有二进制文件删除了部分行怎么办?说控制-H的...

如果你通过od -c(或者如果你有od -aod -ta )管道输出 grep 会发生什么。

如果您将输出存储在一个文件中,使用 grep 只提取一行这样的行,然后使用 od 查看它会发生什么?

于 2013-10-02T15:16:42.453 回答