1

假设我有两个字符串:

string_ex1 = 'AbC024'
string_ex2 = 'aBc24'

string_ex3 = 'AbC24'
string_ex4 = 'aBc24'

如果我相互比较,我想要两个字符串相等的结果。例如'AbC' == 'aBc', '024' == '24'

我已经知道如果我用 \w+ 和 \d+ 区分它们并分别转换为小写和 int,我可以得到一个结果,说两个字符串是相同的。但我想知道是否有一些更简单的功能可以做到这一点。

string1_str = lower(re.findall('\w+', string_ex1))
string1_int = int(re.findall('\d+', string_ex1))
string2_str = lower(re.findall('\w+', string_ex2))
string2_int = int(re.findall('\d+', string_ex2))

if string1_str == string2_str and string1_int == string2_int:
    print('identical')

*编辑 比较应该适用于 string_ex1、string_ex2 和 string_ex3、string_ex4

4

2 回答 2

6

您可以使用删除前导零的正则表达式,然后使用casefold比较:

import re

string_ex1 = 'AbC024'
string_ex2 = 'aBc24'

string_ex1 = re.sub(r'(?<=\D)0+(?=\d)', '', string_ex1)
string_ex2 = re.sub(r'(?<=\D)0+(?=\d)', '', string_ex2)

print(string_ex1.casefold() == string_ex2.casefold())
# True

或者,您可以在调用lower时同时调用两个字符串re.sub

import re

string_ex1 = 'AbC024'
string_ex2 = 'aBc24'

string_ex1 = re.sub(r'(?<=\D)0+(?=\d)', '', string_ex1.lower())
string_ex2 = re.sub(r'(?<=\D)0+(?=\d)', '', string_ex2.lower())

print(string_ex1 == string_ex2)
于 2020-04-18T16:06:54.077 回答
0

没有内置的方法可以做到这一点。我建议你找到两个字符串的组:只有字母,或者只有数字,并以小写形式比较它们,没有前导零

def test(str1, str2):
    values1 = re.findall("([a-z]+|[0-9]+)", str1, flags=re.I)
    values2 = re.findall("([a-z]+|[0-9]+)", str2, flags=re.I)
    clean = lambda x: x.lower().lstrip("0")
    return all(a == b for a, b in zip(map(clean, values1), map(clean, values2)))

print(test('AbC024', 'aBc24'))  # True
于 2020-04-18T16:05:43.197 回答