我是 python 新手,我正在尝试理解 BeautifulSoup。
我做了这段代码它可以工作,但不是我想要的方式:
for abc in soup.findAll(['p',{'a':re.compile('href="/download/*')}]):
value=abc.text
print value
页面多个“块”作为这个:
<div class="">
<div class="ABC">
<p>
<a href="/download/1234/abcde/fghij">String1</a>
</p>
<p class="data">
String2 <a href="/user/4649/abc">String3</a> String2
</p>
</div>
<img src="/img/abc.png" alt="String4" title="String5" />
</div>
我想阅读所有这些“块”并转换为字典(?):
[Link'/download/1234/abcde/fghij', Name'String1', User'String3', alt'String4, title'String5']
有了这个我可以搜索名称并获取链接