我试图从这个网页( http://www.silvan.dk/butikker)的左侧提取城市名称。原因是我需要提取每个城市的物理地址(在链接所指的页面上可以找到,但是我暂时开始提取城市名称)。从这个容器更准确地说。然而,由于我刚刚开始使用 Python 和 Beautifulsoup,我无法提取想要的信息。
结果应该给我:城市,城市链接。
到目前为止,我有:
import urllib2
import sys, locale, os, re
import lxml.etree
from bs4 import BeautifulSoup
def cp65001(name):
if name.lower() == 'cp65001':
return codecs.lookup('utf-8')
html_page = urllib2.urlopen("http://www.silvan.dk/butikker",'w')
soup = BeautifulSoup(html_page)
li = soup.select("ul > li > a")
for link in li:
print link.get('href')
这给了我以下输出:
#1
#2
#3
#4
#5
#6
#7
#8
#9
#10
#11
#12
#13
#14
#15
#16
#17
#18
如果有人可以指导我找到解决方案,我将不胜感激。我厌倦了使用
div = soup.find('div', id='leftContent')
lis = div.find_all('li')
num_lis = len(lis)
但是运行一次后就停止工作了,我不知道为什么?感谢您的时间。