1

这段代码不应该让字符串的开头和结尾有空格。出于某种原因,我对这段代码有负面结果

import re
def is_match(pattern, string):
    return True if len(re.compile(pattern).findall(string)) == 1 else False
print(is_match("[^\s]+[a-zA-Z0-9]+[^\s]+", '1'))

但是,其他字符串工作正常。谁能解释为什么结果为负,甚至提供更好的功能(python 中的新手)。

4

6 回答 6

4

在字符串的开头或结尾检查空格的最简单方法不涉及正则表达式。

if test_string != test_string.strip():
于 2012-04-27T14:52:17.137 回答
4

您正在寻找的正则表达式是^\s|\s$

xs = ["no spaces", "  starts", "ends  ", "\t\tboth\n\n", "okay"]

import re
print [x for x in xs if re.search(r'^\s|\s$', x)]

## ['  starts', 'ends  ', '\t\tboth\n\n']

^\s.*?\s$只匹配两端的空格:

print [x for x in xs if re.search(r'^\s.*?\s$', x, re.S)]

## ['\t\tboth\n\n']

一个逆表达式(没有开始结束的空格)是^\S.*?\S$

print [x for x in xs if re.search(r'^\S.*?\S$', x, re.S)]

## ['no spaces', 'okay']
于 2012-04-27T15:40:01.950 回答
1
def is_whiteSpace(string):
    t=' ','\t','\n','\r'
    return string.startswith(t) or string.endswith(t)


print is_whiteSpace(" GO") -> True
print is_whiteSpace("GO") -> False
print is_whiteSpace("GO ") -> True
print is_whiteSpace(" GO ") -> True
于 2012-04-27T13:53:26.370 回答
1

不需要花哨的正则表达式,只需使用更具可读性的方式:

>>> def is_whitespace(s):
    from string import whitespace
    return any((s[0] in whitespace, s[-1] in whitespace))

>>> map(is_whitespace, ("foo", "bar ", " baz", "\tspam\n"))
[False, True, True, True]
于 2012-04-27T14:49:36.247 回答
0

与其尝试构造一个检测没有空格的字符串的正则表达式,不如检查确实有空格的字符串,然后反转代码中的逻辑。

请记住,如果没有找到匹配项,则re.match()返回None(逻辑假值),如果找到匹配项,则返回对象(逻辑真值)。用它来写这样的东西:SRE_Match

In [24]: spaces_pattern = re.compile ( r"^(\s.+|.+\s)$" )

In [27]: for s in ["Alpha", " Bravo", "Charlie ", " Delta "]:
   ....:     if spaces_pattern.match(s):
   ....:         print ( "%s had whitespace." % s )
   ....:     else:
   ....:         print ( "%s did not have whitespace." % s )
   ....: 
Alpha did not have whitespace.
 Bravo had whitespace.
Charlie  had whitespace.
 Delta  had whitespace.

请注意使用^$锚点来强制匹配整个输入字符串。


编辑:

这甚至根本不需要正则表达式 - 您只需要检查第一个和最后一个字符:

test_strings = ['a', ' b', 'c ', ' d ', 'e f', ' g h', ' i j', ' k l ']
for s in test_strings:
    if s[0] in " \n\r\t":
        print("'%s' started with whitespace." % s)
    elif s[-1] in " \n\r\t":
        print("'%s' ended with whitespace." % s)
    else:
        print("'%s' was whitespace-free." % s)

编辑2:

应该在任何地方都可以使用的正则表达式:^\S(.*\S)?. \S如果您的正则表达式方言不包含它,您可能需要提供与 ("anything but whitespace") 的本地等价物。

test_strings = ['a', ' b', 'c ', ' d ', 'e f', ' g h', ' i j', ' k l ']
import re

pat = re.compile("^\S(.*\S)?$")

for s in test_strings:
    if pat.match(s):
        print("'%s' had no whitespace." % s)
    else:
        print("'%s' had whitespace." % s)

请注意,这\S是 的否定形式\s,即\S表示“除空格之外的任何内容”。

另请注意,长度为 1 的字符串是通过将部分匹配设为可选来计算的。(您可能会考虑使用\S.*\S,但这会强制匹配长度至少为 2。)

'a' had no whitespace.
' b' had whitespace.
'c ' had whitespace.
' d ' had whitespace.
'e f' had no whitespace.
' g h' had whitespace.
' i j' had whitespace.
' k l ' had whitespace.
于 2012-04-27T13:47:38.330 回答
0

ch3ka 建议的变体:

import string
whitespace = tuple(string.whitespace)

'a '.endswith(whitespace)
## True

'a '.startswith(whitespace)
## False

'a\n'.endswith(whitespace)
## True

'a\t'.endswith(whitespace)
## True

我发现它比正则表达式更容易记住(除了可能转换whitespace为元组的位)。

于 2020-06-20T06:42:51.127 回答