10

我正在尝试从字符串中检测所有整数和整数(以及许多其他内容)。以下是我目前使用的正则表达式:

整数:r"[0-9]+"

整数:r"[+,-]?[0-9]+"

以下是问题:

  1. 整数正则表达式也在检测负数,这是我不能拥有的。我该如何解决这个问题?如果我在正则表达式开始之前使用空格,我只会得到正数,但是我会在输出开始时得到一个空格!
  2. 对于整数,我想用格式检测正数,+[0-9]但不带符号存储它们。
  3. 对于整数,我想存储用符号检测到的任何正整数,无论​​它是否存在于原始字符串中。

现在几乎完成了:最后一件事,我有一个字符串,上面写着“加 10 和 -15”。我想将整数存储在列表中。我这样做是使用 findall()。存储数字时,可以将“10”存储为“+10”

4

2 回答 2

28

对于正整数,使用

r"(?<![-.])\b[0-9]+\b(?!\.[0-9])"

解释:

(?<![-.])   # Assert that the previous character isn't a minus sign or a dot.
\b          # Anchor the match to the start of a number.
[0-9]+      # Match a number.
\b          # Anchor the match to the end of the number.
(?!\.[0-9]) # Assert that no decimal part follows.

对于有符号/无符号整数,请使用

r"[+-]?(?<!\.)\b[0-9]+\b(?!\.[0-9])"

单词边界\b对于确保整个数字匹配至关重要。

于 2013-05-27T13:20:36.427 回答
4

你几乎拥有它。

import re

regex = re.compile(r'(\d+)|([\+-]?\d+)')

s = "1 2 3 4 5 6 +1 +2 +3 -1 -2 -3 +654 -789 321"
for r in regex.findall(s):
    if r[0]:
        # whole (unsigned)
        print 'whole', r[0]
    elif r[1]:
        # a signed integer
        print 'signed', r[1]

结果:

>>> 
whole 1
whole 2
whole 3
whole 4
whole 5
whole 6
signed +1
signed +2
signed +3
signed -1
signed -2
signed -3
signed +654
signed -789
whole 321

或者,您可以使用“或”以“更好”的方式获得实际结果:

print [r[0] or r[1] for r in regex.findall(s)]
>>> 
['1', '2', '3', '4', '5', '6', '+1', '+2', '+3', '-1', '-2', '-3', '+654', '-789', '321']

编辑:根据您的问题“是否可以将'10'存储为'+10' ”:

import re

def _sign(num):
    if r[0]:
        return '+%s'%r[0]
    else:
        return r[1]

regex = re.compile(r'(\d+)|([\+-]?\d+)')
s = "1 2 3 4 5 6 +1 +2 +3 -1 -2 -3 +654 -789 321"      
print [_sign(r) for r in regex.findall(s)]
>>>
['+1', '+2', '+3', '+4', '+5', '+6', '+1', '+2', '+3', '-1', '-2', '-3', '+654', '-789', '+321']

或在 1 行中:

print ['+%s'%r[0] if r[0] else r[1] for r in regex.findall(s)]
>>> 
['+1', '+2', '+3', '+4', '+5', '+6', '+1', '+2', '+3', '-1', '-2', '-3', '+654', '-789', '+321']
于 2013-05-27T13:22:17.680 回答