1

我正在尝试使用罗马数字到整数转换器的 preg_match。问题是,对于某些输入, preg_replace 似乎给出的匹配太少了。编码:

function romanNumeralToInt($romanNumeral)
{   preg_match
    (   '/^(M?M?M?)'
        .'((CM)|(CD)|((D?)(C?C?C?)))'
        .'((XC)|(XL)|((L?)(X?X?X?)))'
        .'((IX)|(IV)|((V?)(I?I?I?)))$/', $romanNumeral, $match);
    print_r($match);

    $result=0;
    $result += 1000*strlen($match[1]);
    if(strlen($match[3]) != 0){$result += 900;}
    if(strlen($match[4]) != 0){$result += 400;}
    if(strlen($match[5]) != 0)
    {   $result += 100*strlen($match[7]) + 500*strlen($match[6]);
    }
    if(strlen($match[9]) != 0){$result += 90;}
    if(strlen($match[10]) != 0){$result += 40;}
    if(strlen($match[11]) != 0)
    {   $result += 10*strlen($match[13]) + 50*strlen($match[12]);
    }
    if(strlen($match[15]) != 0){$result += 9;}
    if(strlen($match[16]) != 0){$result += 4;}
    if(strlen($match[17]) != 0)
    {   $result += 1*strlen($match[19]) + 5*strlen($match[18]);
    }

    return $result;
}

echo romanNumeralToInt("XXVIII"); // gives correct results

但是任何以“IV”结尾的罗马数字都会切断最后 3 个匹配项($matches 将只包含元素 0-16 而不是完整的 0-19),同样任何以“IX”结尾的罗马数字都会切断最后一个匹配项4场比赛。

这是预期的行为,还是我的 PHP 有问题?

4

1 回答 1

1

我希望这是预期的行为。=)

正则表达式尝试从左到右匹配 OR 组,一旦找到匹配项就停止,因此如果找到 IV 或 IX,它将永远不会尝试匹配最后三个(或四个)组。

实际上,我认为,如果您的表达式包含 CM 或 XL 或类似的东西,那么其他一些条目也会丢失。

我发现使用RegExr对调试正则表达式有很大帮助。将它用于您的正则表达式,一些组捕获空字符串,而一些组包含 NO MATCH。

于 2010-05-12T07:35:05.847 回答