1

我正在尝试在这里解析一些 html 并使用漂亮的汤

在某一点上,我搜索特定的 div 标签,如下所示:

print soup.find("div", {"class": "sorteringsvalg Alle"})

返回的输出如下:

<div class="sorteringsvalg Alle"> Alle  <label class="sorteringtype">
<input checked="" name="type" type="radio" value="Alle"/>(638) </label></div>

我感兴趣的是括号中的数字,所以我需要进一步处理这些数据。我试过在这个上使用're'正则表达式,但返回的对象没有表示为字符串,所以它不起作用。

4

2 回答 2

0

找到内部输入并获得下一个兄弟

div = soup.find("div", {"class": "sorteringsvalg Alle"})
print div.find("input", value="Alle").next_sibling.strip()

或者,一次性使用CSS 选择器

soup.select("div.Alle input[value=Alle]")[0].next_sibling.strip()
于 2015-08-10T19:16:39.453 回答
0

您可以在标签内获取字符串,如下所示:

print soup.find("label").get_text(strip=True)
于 2015-08-11T11:56:29.847 回答