我真的无法弄清楚这一点。我用 BeautifulSoup 解析了以下链接,我这样做了:
soup.find(text='Title').find_parent('h3')
它什么也没找到。如果您查看链接页面的代码,您会看到一个h3
包含单词的标签Titles
。确切的点是:
<h3 class="findSectionHeader"><a name="tt"></a>Titles</h3>
如果我让 BS 只解析上面的行,它就可以完美地工作。我也试过:
soup.find(text='Title').find_parents('h3')
soup.find(text='Title').find_parent(class_='findSectionHeader')
两者都只适用于在线,但不适用于整个 html。
如果我这样做,soup.find(text='Titles').find_parents('div')
它适用于整个 html。