2

我正在尝试获取从以下位置返回的数据:

http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true

以快速简便的方式进入字典。最好的方法是什么?

谢谢。

4

3 回答 3

8

xml从标准 Python 库中使用:

import xml.etree.ElementTree as xee
contents='''\
<?xml version="1.0" encoding="UTF-8"?>
<Response>
  <Ip>74.125.45.100</Ip>
  <Status>OK</Status>
  <CountryCode>US</CountryCode>
  <CountryName>United States</CountryName>
  <RegionCode>06</RegionCode>
  <RegionName>California</RegionName>
  <City>Mountain View</City>
  <ZipPostalCode>94043</ZipPostalCode>
  <Latitude>37.4192</Latitude>
  <Longitude>-122.057</Longitude>
  <TimezoneName>America/Los_Angeles</TimezoneName>
  <Gmtoffset>-25200</Gmtoffset>
  <Isdst>1</Isdst>
</Response>'''

doc=xee.fromstring(contents)
print dict(((elt.tag,elt.text) for elt in doc))

或使用lxml

import lxml.etree
import urllib2
url='http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true'
doc = lxml.etree.parse( urllib2.urlopen(url) ).getroot()
print dict(((elt.tag,elt.text) for elt in doc))
于 2010-04-04T20:29:56.510 回答
2

我会使用内置的 xml.dom,如下所示:

import urllib
from xml.dom import minidom

data = urllib.urlopen('http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true')
xml_data = minidom.parse(data)
my_dict ={}
for node in xml_data.getElementsByTagName('Response')[0].childNodes:
    if node.nodeType != minidom.Node.TEXT_NODE:
        my_dict[node.nodeName] = node.childNodes[0].data
于 2010-04-04T20:52:07.137 回答
0

xml.etree从python2.5开始的标准库。还看看lxml哪个有相同的界面。我并没有“深入”太多,但我认为这也适用于 python >= 2.5

编辑:

这是解析 xml 的一种快速且非常简单的方法,不要真正将数据放入 dict 但 api 非常直观。

于 2010-04-04T20:02:49.713 回答