<form action="/2811457/follow?gsid=3_5bce9b871484d3af90c89f37" method="post">
<div>
<a href="/2811457/follow?page=2&gsid=3_5bce9b871484d3af90c89f37">next_page</a>
<input name="mp" type="hidden" value="3" />
<input type="text" name="page" size="2" style='-wap-input-format: "*N"' />
<input type="submit" value="jump" /> 1/3
</div>
</form>
我在 STO 上进行了搜索,很多人问如何在标签之间提取文本我想知道如何通过给出定义的文本来提取 href。
在上面的 html 文件中,我想通过给出“next_page”的文本来提取“/2811457/follow?page=2&gsid=3_5bce9b871484d3af90c89f37”。
我所做的是这样的:
t = soup1.findAll(text=re.compile(r'next_page'))
s = t.parent
print s.nextSibling['href']
它返回无
有什么建议吗?