2
from bs4 import BeautifulSoup
source_code = """<a href="#" name="linkName">ok</a>"""
soup = BeautifulSoup(source_code)
print soup.a.? #find the object name

使用上面显示的代码,我正在尝试打印锚标签“名称”,linkName但我不确定我将使用哪个模块或对象,我已经尝试过contentsname并且tag_name_re

有人可以帮帮我吗?谢谢!

4

2 回答 2

5

你已经回答了你的问题。

soup.a['name']

编辑

如果你有多个a元素,你可以这样做:

x = """<x><a name="foo"/><a name="bar"/></x>"""
s = bs4.BeautifulSoup(x)
for a in s.findChildren("a"):
    print(a["name"])
于 2013-10-24T07:14:07.777 回答
0
from bs4 import BeautifulSoup
source_code = """<a href="#" name="linkName"><i><b>ok</b></i></a>"""
soup = BeautifulSoup(source_code)
for tag in soup.findChildren():
    print tag.name

findChildren() 函数将返回一个包含所有子标签的列表。

[<a href="#" name="linkName"><i><b>ok</b></i></a>, <i><b>ok</b></i>, <b>ok</b>]

然后迭代列表以获取每个标签名称。

  Output
    a
    i
    b
于 2015-02-18T10:38:57.823 回答