6

我不擅长正则表达式,所以我什至不知道这个是做什么的,确切地说:

echo preg_match('/^(([a-zA-Z0-9\x2d]{1,63}\x2e)*[a-zA-Z0-9\x2d]{1,63}){1,254}$/', 'example12345678.com>');

我从 Zend Framework 的旧版本 - 1.5 中获取它,该版本已过时,在该框架的最后一个稳定版本中,不再提供此正则表达式。但是,它的行为很奇怪,因为我在官方 php 资源中没有发现任何文档解释或向后不兼容说明。

问题是在 php 5.2.* 上它工作正常:返回 0。在 php 5.3.10、5.4.0(很可能是 5.3. 、5.4。我想)它返回 FALSE,意思是“错误”。

我的问题是:为什么?错误是什么?是正则表达式、某种递归还是规则歧义?如果是这样,为什么它适用于 php 5.2?


有趣的是,如果我将 'example12345678.com>' 更改为 'example1234567.com>' (使其缩短一个或多个字符) - 它开始工作并返回 0。如果我将其更改为 '123123123123123123123123123' 它也可以工作并返回 1 .

UPD:还不知道这是否重要,但这里的 pcre 版本是 8.02 (php 5.2) vs 8.12 (php 5.3)


UPD2:我确实理解它的用途......或多或少......现在让任何东西工作都没有问题。正如我所说 - Zend_Validate_* 更新解决了它。我将尝试用其他语言来描述我的担忧:

比如说,我升级了一个重要的软件,使php5.2 > php5.3 切换。我尝试查找有关我可能面临的所有问题的信息(主要是通过阅读以下内容:http: //php.net/manual/en/migration53.php)。该软件有点旧,但并不古老,例如 Zend Framework 可能是 1.5 版本。我检查/修补/分析并修复每个 bc 中断和不推荐使用的功能。甚至我的单元测试也运行良好。

令我惊讶的是,问题中描述的事情发生了。(准确地说,Zend_Validate_Hostname 会抛出异常)。所以现在我想知道为什么我在升级时错过了这个,更重要的是,我是否应该重新检查应用程序中的所有“preg_match”(以及其他利用 PCRE 的函数),尝试各种可以想象的输入数据以试图找到类似的“错误修复” ”。

如果是“错误修复”。因为它看起来像一个新错误——它曾经在 php5.2 中按预期工作,但现在不再工作了。

希望能找到一些线索来缩小搜索范围。

4

1 回答 1

3

这是一个丑陋的正则表达式。问题是,字符串可能匹配的方式太多,因此引擎在发现它实际上不匹配之前尝试了所有的内存不足。

此外,它似乎正在尝试匹配有效的域名,但事实并非如此。我会用preg_match调用这个函数来代替那个调用:

function is_valid_domain_name($string) {
    if (strlen($string) > 253) {
        return false;
    }
    $label = '(?!-)[a-zA-Z0-9-]{0,63}(?<!-)';
    return preg_match("/^(?:$label\.){0,126}$label$/", $string);
}

它在您的问题字符串上快速失败:

echo is_valid_domain_name('example12345678.com>'),"\n";
于 2012-05-17T23:52:50.593 回答