0

我刚刚开始使用 BS4,但我似乎无法找到为什么我无法提取下表中的文本 -> http://pastebin.com/MCQC7wLY

这是我的代码:

    for team in soup.find_all('tr'):
    print team.a.string

我收到以下错误

AttributeError:“NoneType”对象没有属性“字符串”

我也尝试过其他的东西,比如

for team in soup.find_all('tr'):
    print team.find('a').string

但我总是遇到同样的错误。

这就是 team.find('a') 返回的

<a href="/entry/688922/event-history/7/">FC Lasne</a>

我想提取“FC Lasne”

这让我发疯,因为通常我只是做 find('a').string 并且它只是工作

我应该如何进行?

谢谢

4

1 回答 1

0

您的示例中的第一个tr没有任何a标签。

您可以忽略任何tr没有链接的 s :

for team in soup.find_all('tr'):
    link = team.find('a')
    if link == null:
       continue
    print link.string

虽然你可以这样做:

soup.find_all('a')
于 2012-10-06T20:30:17.000 回答