1

我正在尝试遍历一堆 html 标签,但需要一些指导。我将如何使用 Beautiful Soup 遍历一堆表格行,并输出链接文本?

HTML:

<div id="thisDiv">
    <table class="thisTable">
        <tr>
            <td><a href="blablabl">BLABLABLA1</a></td><td><a href="blablabla2">BLABLABLA2</a></td>
        </tr>
        <tr>
            <td><a href="blablab3">BLABLABLA3</a></td><td><a href="blablabla4">BLABLABLA4</a></td>
        </tr>
        <tr>
            <td><a href="blablab5">BLABLABLA5</a></td><td><a href="blablabla6">BLABLABLA6</a></td>
        </tr>
    </table>
</div>
4

1 回答 1

1

您不必遍历行。只需找到该表并搜索它包含的所有锚点:

soup = BeautifulSoup(doc)
table = soup.find('table', {'class':'thisTable'}) 
for a in table.findAll('a'):
    print a.text
于 2012-12-23T22:58:21.323 回答