我在 php preg_match 中使用了一些正则表达式来去除“:”和“(”中的尾随空格
([\(:])\s+
我遇到的问题是它最终会去掉引号内我需要的空格。例如,这个字符串:
img[style*="float: left"]
有没有办法编写正则表达式,使其匹配任何“:”或“(”,除非它用双引号引起来?
我在 php preg_match 中使用了一些正则表达式来去除“:”和“(”中的尾随空格
([\(:])\s+
我遇到的问题是它最终会去掉引号内我需要的空格。例如,这个字符串:
img[style*="float: left"]
有没有办法编写正则表达式,使其匹配任何“:”或“(”,除非它用双引号引起来?
有两种方法可以解决这个问题:
您可以使用否定环视(信息here)来尝试断言在您不想剥离的内容之前或之后没有双引号。我遇到的问题是没有迹象表明离引号有多远:
或(
可能有多远,并且环视不能是未知长度。
我喜欢做的是“保留”包含在双引号中的任何内容,将正则表达式\"[^"]+\"
放在数组中,并用字符串替换它们(我使用“THIS_IS_A_QUOTE”)。将所有引号存储在数组中后,去除所有空格,最后使用数组中的字符串恢复所有“THIS_IS_A_QUOTE”字符串。
你可以试试这个:
$text = preg_replace('~(?|(\\\{2}|\\\"|"(?>[^"\\\]+|\\\{2}|\\\")*+")|([:(])\s+)~', '$1', $text);
这个想法是匹配之前的双引号部分([:(])\s+
并自行替换它们。
为了避免匹配转义引号,反斜杠之前匹配。
图案细节:
~ # pattern delimiter
(?| # branch reset : all capture groups inside have the same number
( # open a capturing group
\\\{2} # group of 2 backslashes (can't escape everything)
| # OR
\\\" # an escaped double quote
| # OR
"(?>[^"\\\]+|\\\{2}|\\\")*+" # content inside double quotes
) # close the capturing group
| # OR
( [:(] ) # a : or a ( in a capturing group
\s+ # spaces
) # close the branch reset group
~ # pattern delimiter
兴趣是处理这种情况:
img: " : \" ( "
img: \" : ( " ( "
img: \\" : ( " ( "
结果:
img:" : \" ( "
img:\" :(" ( "
img:\\" : ( " ("
该例程将:
代码
<?php
$string = 'img[style*="float: left"]
img: [style*="float: left"]
img( [style*="float: left"]
';
$regex = '/"[^"]*"|([:(])\s+/ims';
$output = preg_replace_callback(
$regex,
function ($matches) {
if (array_key_exists (1, $matches)) {
return $matches[1] ;
}
return $matches[0];
},
$string
);
echo "this is the output:" . $output;
输出
this is the output:img[style*="float: left"]
img:[style*="float: left"]
img([style*="float: left"]