1

这应该很简单,但我不能很细枝。我想从此 html 字符串中获取名称:

  soup =   </ul>
  Brian
  <p class="f">

我试过了:

namePattern = re.compile(r'(?<=</ul>)(.*?)(?<=<p)')
rev.reviewerName = re.findall(namePattern,  str(soup))

namePattern = re.compile(r'</ul>(.*?)<p')

你能告诉我怎么做吗?谢谢。

4

1 回答 1

3

默认情况下,.不匹配换行符。您需要指定re.DOTALLre.compile().

请注意,这将包括换行符作为捕获组的一部分。如果你不想这样,你可以明确地将它们与\s*

In [5]: re.findall(r'</ul>\s*(.*?)\s*<p', s)
Out[5]: ['Brian']
于 2012-12-18T21:10:43.363 回答