0

我有以下列表:

l = ['(PREDIR )?NAME SUFTYP|PREDIR NAME( SUFTYP)?', '(PREDIR )?NAME|PREDIR NAME', '(PREDIR )?PRETYP NAME SUFTYP( SUFDIR)?|PREDIR (PRETYP )?NAME( SUFTYP)? SUFDIR', '(PREDIR )?PRETYP NAME|PREDIR (PRETYP )?NAME', 'NAME SUFTYP( SUFDIR)?|NAME( SUFTYP)? SUFDIR', 'NAME SUFTYP|NAME( SUFTYP)?', 'NAME|NAME', 'PRETYP NAME ( SUFDIR)?|(PRETYP )?NAME SUFDIR']

我想查找?仅包含在一侧的项目|,并仅替换为包含的一侧?

具体来说,我希望我希望将其中的项目l替换为以下内容:

'(PREDIR )?NAME|PREDIR NAME'->'(PREDIR )?NAME'

'(PREDIR )?PRETYP NAME|PREDIR (PRETYP )?NAME'->'(PREDIR )?PRETYP NAME|PREDIR (PRETYP )?NAME'

'NAME SUFTYP|NAME( SUFTYP)?'->'NAME( SUFTYP)?'

我能想到的唯一方法是通过一个迭代过程,我?首先检查左侧而不是右侧,然后反之亦然。

以下不起作用。

for i in l:
    i = re.sub(r'(.*?\?.*?)(\|.*?[^?].*?)',r'\1',i)
4

2 回答 2

1

试试这个:

l = ['(PREDIR )?NAME SUFTYP|PREDIR NAME( SUFTYP)?', '(PREDIR )?NAME|PREDIR NAME', 
     '(PREDIR )?PRETYP NAME SUFTYP( SUFDIR)?|PREDIR (PRETYP )?NAME( SUFTYP)? SUFDIR', 
     '(PREDIR )?PRETYP NAME|PREDIR (PRETYP )?NAME', 
     'NAME SUFTYP( SUFDIR)?|NAME( SUFTYP)? SUFDIR', 'NAME SUFTYP|NAME( SUFTYP)?', 
     'NAME|NAME', 'PRETYP NAME ( SUFDIR)?|(PRETYP )?NAME SUFDIR']

import re

l2 = []
for elem in l:
    inner = re.split("\|", elem);

    left = '?' in inner[0]
    right = '?' in inner[1]

    if (left and right) or not (left or right): 
        # Either both side of `|` have `?` or none of the sides have `?`
        l2.append(elem)
    elif left:
        l2.append(inner[0])
    else:
        l2.append(inner[1])

print l2
于 2013-02-15T18:00:54.773 回答
1

因此,如果我理解您,您想将字符串拆分为|,并且如果其中恰好有一部分包含 a ?,则返回该字符串,否则返回字符串?我不确定正则表达式是否值得头疼:为什么不呢

def fix(s):
    has_qmark = [part for part in s.split("|") if '?' in part]
    return has_qmark[0] if len(has_qmark) == 1 else s

反而?它实际上是英文的。

>>> fix('(PREDIR )?NAME|PREDIR NAME')
'(PREDIR )?NAME'
>>> fix('(PREDIR )?PRETYP NAME|PREDIR (PRETYP )?NAME')
'(PREDIR )?PRETYP NAME|PREDIR (PRETYP )?NAME'
>>> fix('NAME SUFTYP|NAME( SUFTYP)?')
'NAME( SUFTYP)?'
于 2013-02-15T18:05:32.873 回答