python - 如何使用负面的回顾

Question

基本上，我在给定样式表中将任何和所有具有蓝色色调的十六进制值更改为对应的红色色调（即#00f更改为#ff0000（我的函数输出六个字符的十六进制值，不包括#））。

创建正则表达式以匹配十六进制颜色不是问题（我不关心 HTML 颜色名称，尽管我最终可能关心rgb, rgba,hsb等值。）。这就是我最终的结果#(([0-9A-z]{3}){1,2})。它有效，但我希望它能够充分证明。例如，如果有人碰巧设置了#top带有有效十六进制值的片段（即）的背景图像，我不想更改它。我试着做一个负面的回顾，但它似乎不起作用。我正在使用\B#(([0-9A-z]{3}){1,2})，但如果在“#”之前有一个单词边界（例如空格），它与 URL 片段匹配。这是我认为应该做的伎俩，但没有：(?<!url\([^#)]*)#(([0-9A-z]{3}){1,2})。

我正在使用RegExr的桌面版本来测试以下样式表：

body {
    background: #f09 url('images#06F');
}
span {
    background=#00f url('images#889');
}
div {
    background:#E4aaa0 url('images#889');
}
h1 {
    background: #fff #dddddd;
}

每当我将鼠标悬停在(?<!子字符串上时，RegExr 都会将其标识为“匹配' '的负前瞻url\([^#)]*”。可能有错误还是我只是有一个糟糕的正则表达式日？在我们讨论的同时，是否还有其他上下文中将“#”用于非十六进制目的？

编辑：好吧，我不能一大早就编程。该十六进制正则表达式应该是#(([0-9A-Fa-f]{3}){1,2})

编辑 2：好的，所以我错过了大多数语言需要静态长度后视的细节。

score 0 · Accepted Answer

我认为您需要的是以下解决方案之一或其他

ss = '''    background: #f09 url('images#06F'); 
    background=#00f url('images #889'); 
    background:#E4aaa0 url('images#890'); 
    background: #fff #dddddd; '''

print ss
import re

three = '(?:[0-9A-Fa-f]{3})'

regx = re.compile('^ *background[ =:]*#(%s{1,2})' % three,re.MULTILINE)
print regx.findall(ss)

print '-----------------------------------------------------'

regx = re.compile('(?:(?:^ *background[ =:]*)|(?:(?<=#%s)|(?<=#%s%s)) +)'
                  '#(%s{1,2})' % (three,three,three,three),
                  re.MULTILINE)
print regx.findall(ss)

结果

    background: #f09 url('images#06F'); 
    background=#00f url('images #889'); 
    background:#E4aaa0 url('images#890'); 
    background: #fff #dddddd; 
['f09', '00f', 'E4aaa0', 'fff']
-----------------------------------------------------
['f09', '00f', 'E4aaa0', 'fff', 'dddddd']

编辑 1

ss = '''    background: #f09 url('images#06F'); 
    background=#00f url('images #889'); 
    color:#E4aaa0 url('images#890'); 
    background: #fff #dddddd#125e88    #ae3;
    Walter (Elias) Disney: #f51f51 '''

print ss+'\n'

import re

three = '(?:[0-9A-Fa-f]{3})'

regx = re.compile('^ *[^=:]+[ =:]*#(%s{1,2})' % three,re.MULTILINE)
print regx.findall(ss)

print '-----------------------------------------------------'

regx = re.compile('(?:(?:^ *[^=:]+[ =:]*)|(?:(?<=#%s)|(?<=#%s%s)) *)'
                  '#(%s{1,2})' % (three,three,three,three),
                  re.MULTILINE)
print regx.findall(ss)

结果

    background: #f09 url('images#06F'); 
    background=#00f url('images #889'); 
    color:#E4aaa0 url('images#890'); 
    background: #fff #dddddd#125e88    #ae3;
    Walter (Elias) Disney: #f51f51 

['f09', '00f', 'E4aaa0', 'fff', 'f51f51']
-----------------------------------------------------
['f09', '00f', 'E4aaa0', 'fff', 'dddddd', '125e88', 'ae3', 'f51f51']

编辑 2

ss = '''    background: #f09 url('images#06F'); 
    background=#00f url('images #889'); 
    color:#E4aaa0 url('images#890'); 
    background: #fff #dddddd#125e88    #ae3;
    Walter (Elias) Disney: #f51f51
    background: -webkit-gradient(linear, from(#000000), to(#ffffff));. '''

print ss+'\n'

import re

three = '(?:[0-9A-Fa-f]{3})'

preceding = ('(?:(?:^[^#]*)'
                 '|'
                 '(?:(?<=#%s)'
                     '|'
                     '(?<=#%s%s)'
                     '|'
                     '(?<= to\()'
                     ')'
                 ')') % (three,three,three)

regx = re.compile('%s *#(%s{1,2})' % (preceding,three), re.MULTILINE)
print regx.findall(ss)

结果

    background: #f09 url('images#06F'); 
    background=#00f url('images #889'); 
    color:#E4aaa0 url('images#890'); 
    background: #fff #dddddd#125e88    #ae3;
    Walter (Elias) Disney: #f51f51
    background: -webkit-gradient(linear, from(#000000), to(#ffffff));. 

['f09', '00f', 'E4aaa0', 'fff', 'dddddd', '125e88', 'ae3', 'f51f51', '000000', 'ffffff']

正则表达式非常强大，条件是必须有足够的字符串部分遵循某个组织，在要捕获的可变其他部分之间具有相对稳定性。如果分析的文本在结构上变得过于松散，就不可能编写正则表达式。

您的琴弦是否还有许多其他“类似 Harlequin 的拼凑”结构？

python - 如何使用负面的回顾

1 回答 1

编辑 1

编辑 2

Related

Reference