0

我想用 BeautifulSoup 遍历 HTML 文件并找到带有内容的标签,“首选名称”这是我要查找的标签:(这是我要搜索的文件的一部分):

 <td nowrap class="label">
    Preferred Name
    <span class="slot_labels"></span>
  </td>

我试图用这个搜索(doc是那个html文件的名称):

 soup = BeautifulSoup(doc)
 tags = soup.fetch('td')
 for tag in tags:
     if tag.contents[0] == 'Preferred Name':
         return tag

此代码不起作用,有人可以帮助...?

4

1 回答 1

0

内容包括空格,所以试试这个:

soup = BeautifulSoup(doc)
tags = soup.fetch('td')
for tag in tags:
    if tag.contents[0] and tag.contents[0].strip() == 'Preferred Name':
        return tag
于 2013-03-01T00:47:35.783 回答