我正在尝试在 URL 字符串上使用 python 正则表达式。
id= 'edu.vt.lib.scholar:http/ejournals/VALib/v48_n4/newsome.html'
>>> re.search('news|ejournals|theses',id).group()
'ejournals'
>>> re.findall('news|ejournals|theses',id)
['ejournals', 'news']
根据http://docs.python.org/2/library/re.html#finding-all-adverbs上的文档,它说 search() 匹配第一个并找到所有匹配字符串中所有可能的匹配项。
我想知道为什么“新闻”没有被搜索捕获,即使它是在模式中首先声明的。
我使用了错误的模式吗?我想搜索字符串中是否出现任何这些关键字。