我正在尝试使用 beautifulsoup 为来自维基百科的人获取生日。例如http://en.wikipedia.org/wiki/Ezra_Taft_Benson的生日是 1899 年 8 月 4 日。要到生日,我使用以下代码:
bday = url.find("span", class_="bday")
bday
但是,它正在获取作为另一个标签的一部分出现在 html 代码中的实例。即<span class="bday dtstart published updated">1985-11-10 </span>
。
有没有办法只匹配确切的类标签bday
?
我希望这个问题很清楚,因为目前我得到的bday
是 1985-11-10,这不是正确的日期。