我对如何从特定站点的模板中获取数据感到困惑。该网站的网址是:http ://www.dnainfo.com/chicago/2013-chicago-murders/timeline?mon=1
, 月份从一月开始。在源代码中,模板显示为:id="homicide_template"。因此,我使用下面的代码来获取带有元素的特定模板:
import urllib2
import urllib
from bs4 import BeautifulSoup
url = urllib2.urlopen('http://dnainfo.com/chicago/2013-chicago-murders/timeline?mon=1')
html = url.read()
soup = BeautifulSoup(html)
site_template = soup.find(id="homicide_template")
print site_template
我不确定如何从每个人的模板中获取年龄、种族、原因、邻居和时间的数据,并将它们保存到数据库或 .csv 文件中。我刚刚开始使用这些模块(urllib2 和 BeautifulSoup 4)。因此,感谢任何帮助/指导。谢谢。