2

我一直在尝试排除 Google Analytics 中的四个 IP 范围(编辑:只有第三个八位位组的范围是 1-128。第四个是“静态”,如下所述)。我的 Google Analytics 可以利用的正则表达式技能并不是最好的。我希望在这里获得一些关于如何构建我的正则表达式的帮助,以便它做我想要的。

我希望排除的 IP 范围是:

10.130.1.0 - 10.130.128.0,

10.130.1.99 - 10.130.128.99

10.132.1.0 - 10.132.128.0

10.132.1.1 - 10.132.128.1。

如您所见,有一些静态部分和一些更“动态”的部分。

我创建的完整正则表达式如下所示(将其分开以便于阅读,但实际上它在一行上):

^10.130.([1-9]|[1-9][0-9]|1([0-1][0-9]|2[0-8])).0|

10.130.([1-9]|[1-9][0-9]|1([0-1][0-9]|2[0-8])).99|

10.132.([1-9]|[1-9][0-9]|1([0-1][0-9]|2[0-8])).0|

10.132.([1-9]|[1-9][0-9]|1([0-1][0-9]|2[0-8])).1$

我做对了吗?我还没有真正完全掌握分组(),或者如果我需要将不同范围的每个单独部分组合在一起,比如(10\.130\.([1-9]|[1-9][0-9]|1([0-1][0-9]|2[0-8]))\.0),或者保持原样,没有()?

我是否正确分组,这是一个好方法吗?

4

2 回答 2

4

确定适用的 IP 地址

问题中的IP地址范围很混乱,意图可能是

10.130.1.0 - 10.130.128.99
10.132.1.0 - 10.132.128.1

这个答案是基于这种情况的假设 - 我已经阅读了关于只想将范围应用于第三个八位字节的评论,但很可能这是一个误解(或者这确实是意图 - 但不太可能是所以对于任何未来的读者)。

作为正则表达式

IP范围可以表示为:

10.130.1.0 - 10.130.127.254*
10.130.128.0 - 10.130.128.99
10.132.1.0 - 10.132.127.254*
10.132.128.0 - 10.132.128.1

请注意,标有星号的两个范围涵盖了最后一个八位字节的整个范围,因此在模式中任何数字都符合条件。因此在伪正则表达式中需要的是:

10.130.[1 to 127].*
10.130.128.[0 to 99]
10.132.[1 to 127].*
10.132.128.[0 or 1]

每个范围都需要是处理组成这些数字的数字的正则表达式。

1 至 127

有 1 到 3 位数字,使用正则表达式处理时会有些复杂 - 但是可以这样分解:

[1-9] # 1-9
[0-9]{2} # 10-99
1[0-1][0-9] # 100 - 119
12[0-7] # 120-127

或者:

([1-9]|[0-9]{2}|1[0-1][0-9]|12[0-7])

0 到 99

这很容易,因为它是一位或两位数:

[0-9]{1,2}

0 或 1

也很容易:

[0-1]

全部一起:

因此,作为一个完整的正则表达式,整个范围可以表示为:

^10\.(
    130\.([1-9]|[0-9]{2}|1[0-1][0-9]|12[0-7])\.[0-9]{1,3} |
    130\.128\.[0-9]{1,2} |
    132\.([1-9]|[0-9]{2}|1[0-1][0-9]|12[0-7])\.[0-9]{1,3} |
    132\.128\.[0-1]
)$

请注意,将正则表达式锚定到字符串的末尾是个好主意,否则是一个 IP 地址,例如

10.130.128.111
^^^^^^^^^^^^^

超出定义范围的将匹配,最后一个数字被忽略。

简化假设

Google 不太可能提交无效的 IP 地址,因此可以对上述正则表达式进行一些简化 -[0-9]并且[1-9]可以同等对待,这意味着:

[1-9] # 1-9
[0-9]{2} # 10-99

变成:

[0-9]{1,2} # 1-99, one or two digits

因此,正则表达式可以表示为稍微简单一些:

^10\.(
    130\.([0-9]{1,2}|1[0-1][0-9]|12[0-7])\.[0-9]{1,3} |
    130\.128\.[0-9]{1,2} |
    132\.([0-9]{1,2}|1[0-1][0-9]|12[0-7])\.[0-9]{1,3} |
    132\.128\.[0-1]
)$

此外,[0-9]可以写成\d这样使得正则表达式稍微不那么冗长::

^10\.(
    130\.(\d{1,2}|1[0-1]\d|12[0-7])\.\d{1,3} |
    130\.128\.\d{1,2} |
    132\.(\d{1,2}|1[0-1]\d|12[0-7])\.\d{1,3} |
    132\.128\.[0-1]
)$
于 2013-10-29T11:02:39.913 回答
1

你做对了,你有它的方式。我不知道你是在尝试匹配包含还是排除——我假设排除——只要你知道^是一个,匹配一个字符串的开头,而不是只存在于字符内部的否定运算符类

不过,我认为这更容易阅读:

^10\.130\.([1-9][0-9]?|1[01][0-9]|12[0-8])\.(0|99)$

^10\.132\.([1-9][0-9]?|1[01][0-9]|12[0-8])\.(0|1)$
于 2013-10-29T10:19:15.343 回答