我在网站和 stackoverflow 上查看了许多示例,但找不到针对我的问题的通用解决方案。我正在处理一个非常混乱的网站,我想抓取一些数据。标记看起来像这样:
...
<body>
...
<table>
<tbody>
<tr>
...
</tr>
<tr>
<td>
...
</td>
<td>
<table>
<tr>
...
</tr>
<tr>
<td>
<a href="...">Some link</a>
<a href="...">Some link</a>
<a href="...">Some link</a>
</td>
</tr>
</table>
</td>
</tr>
</tbody>
</table>
</body>
我遇到的问题是,没有一个元素具有我可以选择以缩小某些范围的属性。在每个“...”中可能有类似的标记,例如 more<a>
之类的<table>
。
我知道这table tr table tr td a
是我需要的链接所独有的,但是 BeautifulSoup 将如何获取这些链接?我不确定如何在不执行一堆单独的代码行的情况下获取嵌套标签。
有什么帮助吗?