我一直在尝试从一个站点获取信息,最近发现它存储在 childNodes[0].data 中。我对 python 很陌生,从未尝试过针对网站编写脚本。
有人告诉我,我可以制作一个 tmp.xml 文件,并从那里提取信息,但由于它只获取源代码(我认为这对我没有用),我没有得到任何结果。
当前代码:
response = urllib2.urlopen(get_link)
html = response.read()
with open("tmp.xml", "w") as f:
f.write(html)
dom = parse("tmp.xml")
name = dom.getElementsByTagName("name[0].firstChild.nodeValue")
我也试过使用 'dom = parse(html)' 没有更好的结果。