根据您上面的评论,我建议 BeautifulSoup 与任何与 HTML 相关的内容。由于您处于学习阶段的早期,可能最好将“HTML”与“BeautifulSoup”(而不是正则表达式:))联系起来。这是一个非常基本的例子:
In [1]: from bs4 import BeautifulSoup
In [2]: html = """
<option value="1b4f4aed-cf1f-4b39-ae27">Foo</option>
<option value="1a05f93f-dd51-449d-b039">Bar</option>
<option value="f62d2d29-29fc-4f7c-9331">Bacon</option>
"""
In [3]: soup = BeautifulSoup(html)
In [4]: for option in soup.find_all('option'):
...: print option.text
...:
Foo
Bar
Bacon
在这里,我们将 HTML 传递给BeautifulSoup
并将其分配给soup
变量。现在我们有一个对象,其中包含我们的 HTML 和大量以用户友好的方式与之交互的方法。在这里,我们使用find_all
方法(此处的文档)来查找option
HTML 中的所有标签。现在,当我们迭代时,我们正在迭代Tag
对象,这些对象具有自己的特殊属性/方法。在这里,我们选择其中一个 ( .text
) 来显示Tag
元素的文本(在这种情况下,将是包含在标签中的文本)。