0

我想获取此链接的位置信息:https ://en.wikipedia.org/wiki/Alabama_Institute_for_the_Deaf_and_Blind ,位于页面右侧的信息框中。

我尝试了以下方法:

from bs4 import BeautifulSoup
soup = BeautifulSoup(requests.get(site).text)
soup.find(('tr','adr').children

soup.find(('tr','adr').children.contents()

soup.find(('tr','adr').children.text

无济于事。

4

2 回答 2

1

只打印.text

>>> print soup.find('tr', 'adr').text

205 South St E
Talladega, Alabama, United States

您可能想要删除前导和尾随空格:

>>> soup.find('tr', 'adr').text.strip()
u'205 South St E\nTalladega, Alabama, United States'
>>> print soup.find('tr', 'adr').text.strip()
205 South St E
Talladega, Alabama, United States
于 2013-08-12T20:43:18.967 回答
0
    for i in soup.find_all('tr'):
        print i.text

这是获得所有 tr 的更好方法。

于 2013-08-12T20:44:33.900 回答