我有一个 HTML 代码如下:
<div class="content">
<div class="title">
<a id="hlAdv" class="title" href="./sample.aspx">
<font size=2>Pretty Beauty Fiesta -1st Avenue Mall!</font>
</a>
</div>
19<sup>th</sup> ~ 21<sup>st</sup> Apr 2013
</div>
我现在正在使用 Python,并尝试使用 BeatifulSoup 找出日期。我期望的是:
19th ~ 21st Apr 2013
我试过了:
find("div", {"class":"content"}).text
输出:
Pretty Beauty Fiesta -1st Avenue Mall!19th ~ 21st Apr 2013
和,
find("div", {"class":"content"}).div.nextSibling
输出:
19
我尝试使用更多 nextSibling 来获取内容,但我仍然无法正确获取“st Apr 2013”。
我怎样才能得到我想要的数据?谢谢你。