您将如何编写一个接收两个字符串并在它们匹配时返回 true 的函数(不使用正则表达式)。
约束如下:
- 字符串 1(要匹配的文本)将包含字母和数字。
- 字符串 2 是模式,将是字母、数字
.
和*
,其中.
表示字母或数字都将被视为匹配,并且*
表示前一个字符重复 0 次或多次。
例如:
Text: Facebook
Pattern: F.cebo*k
returns True
对此并不特别自豪(@JoranBeasley 的回答是最好的),但如果没有正则表达式,这将有效(似乎):
def Matcher(pattern, text):
comp = zip(pattern, text)
for i, vals in enumerate(comp):
if vals[0] != vals[1]:
if vals[0] == '.' and vals[1].isalnum():
continue
elif vals[0] == '*' and vals[1] == comp[i-1][0]:
continue
else:
return False
return True
print 'F.cebo*k -> Facebook'
print Matcher('F.cebo*k', 'Facebook')
print 'St.c.koverflow -> Stackoverflow'
print Matcher('St.c.koverflow', 'Stackoverflow')
# And for nostalgia...
print 'St.ckoverfl*w -> Stackoverfllw'
print Matcher('St.ckoverfl*w', 'Stackoverfllw')
我确定它充满了错误(例如,如果字符串以 a 开头*
),但我的代码通常是。
您刚刚描述的内容被称为正则表达式(尽管.
在正则表达式中表示“任何东西”)......已经有一个库
你的例子也是错误的..因为"flow"
不匹配"fl*w"
,但它会匹配"fl.w"
import re
string2=string2.replace(".","[0-9a-zA-Z]")
print re.match(string2,string1)
这是一个状态机实现,它应该适用于所有情况,除非它以 * 开头
def matcher(pat,txt):
last = None
try:
for ltr in txt:
if ltr == pat[0]:
pat = pat[1:] #consume
elif pat[0] == "*" and ltr == last:
#dont consume
continue # dont change last
elif pat[0] == "*" and ltr == pat[1]:
pat = pat[2:] #consume 2 (* + whatever)
elif pat[0] =="*" and last == ".":
continue #dont consume and dont change last
elif pat[0] == ".":
pat = pat[1:]#consume
elif pat[1] == "*" and ltr == pat[2]:
pat = pat[3:] #consume 3 (x*X)
else:
return False
last = ltr
except IndexError:
return False #there was a problem that made it break ... it also doesnt match
if not pat or pat == "*":
return True
return False
print "Matching Pattern bo*k"
for word in "boak,bok,book,booooooook,boo,bk".split(","):
print word ," ?=",matcher("bo*k",word)
哪个输出
Matching Pattern bo*k
boak ?= False
bok ?= True
book ?= True
booooooook ?= True
boo ?= False
bk ?= True
您可能想查看正则表达式。如果他们发现了什么,他们会返回 true。
import re
if re.findall(regex, string):
print "You found it!"
正则表达式将帮助您链接