python - 在 Python 中捕获正则表达式

Question

我想在 Python 中使用正则表达式来获取</html>标记后的所有内容，并将其放入字符串中。所以我试图理解如何在 Python 中做到这一点，但我无法让它工作。谁能解释我如何做这个荒谬的简单任务？

score 6 · Accepted Answer

6

您可以在没有正则表达式的情况下执行此操作：

text[text.find('</html>')+7:]

于 2012-10-04T21:41:14.907 回答

score 2 · Accepted Answer

m = re.match(".*<\html>(.*)",my_html_text_string)
print m.groups()

甚至更好

print my_html_string.split("</html>")[-1]

score 1 · Accepted Answer

1

import re

text = 'foo</html>bar'
m = re.search('</html>(.*)', text)
print m.group(1)

于 2012-10-04T21:42:53.950 回答

3 回答 3