10

我正在使用 GeoPy 将地址地理编码为 lat,lng。我还想提取每个地址的逐项地址组件(街道、城市、州、邮编)。

GeoPy 返回一个带有地址的字符串——但我找不到分离每个组件的可靠方法。例如:

123 Main Street, Los Angeles, CA 90034, USA =>
{street: '123 Main Street', city: 'Los Angeles', state: 'CA', zip: 90034, country: 'USA'}

Google 地理编码 API 确实返回了这些单独的组件……有没有办法从 GeoPy 中获取这些组件?(或不同的地理编码工具?)

4

4 回答 4

26

您还可以从Nominatim()地理编码器(geopy 的标准开源地理编码器)中获取各个地址组件。

from geopy.geocoders import Nominatim

# address is a String e.g. 'Berlin, Germany'
# addressdetails=True does the magic and gives you also the details
location = geolocator.geocode(address, addressdetails=True)

print(location.raw)

{'type': 'house',
 'class': 'place',
 'licence': 'Data © OpenStreetMap contributors, ODbL 1.0. http://www.openstreetmap.org/copyright',
 'display_name': '2, Stralauer Allee, Fhain, Friedrichshain-Kreuzberg, Berlin, 10245, Deutschland',
 'place_id': '35120946',
 'osm_id': '2825035484',
 'lon': '13.4489063',
 'osm_type': 'node',
 'address': {'country_code': 'de',
             'road': 'Stralauer Allee',
             'postcode': '10245',
             'house_number': '2',
             'state': 'Berlin',
             'country': 'Deutschland',
             'suburb': 'Fhain',
             'city_district': 'Friedrichshain-Kreuzberg'},
 'lat': '52.5018003',
 'importance': 0.421,
 'boundingbox': ['52.5017503', '52.5018503', '13.4488563', '13.4489563']}

location.raw['address']

你得到的字典只有组件。

查看geopy 文档以获取更多参数或所有地址组件的Nominatim

于 2016-11-07T22:59:24.970 回答
5

usaddress由 DataMade使用。这是GitHub 存储库

它像这样工作usaddress.parse('123 Main St. Suite 100 Chicago, IL')并返回这个数组

[('123', 'AddressNumber'), ('Main', 'StreetName'), ('St.', 'StreetNamePostType'), ('Suite', 'OccupancyType'), ('100', 'OccupancyIdentifier'), ('Chicago,', 'PlaceName'), ('IL', 'StateName')]

于 2015-01-29T16:44:41.393 回答
2

这就是我实现这种拆分的方式,因为我希望得到的地址始终采用相同的格式。您只需要跳过连接并重新运行每个值...或将其放入列表中。由你决定。

 def getaddress(self, lat, lng, language="en"):
        try:
            geolocator = Nominatim()
            string = str(lat) + ', ' +str(lng)
            location = geolocator.reverse(string, language=language)
            data = location.raw
            data = data['address']
            address = str(data)

            street = district = postalCode= state = country = countryCode = ""

            district    =str(data['city_district'])
            postalCode  =str(data['postcode'])
            state       =str(data['state'])
            country     =str(data['country'])
            countryCode =str(data['country_code']).upper()
            address = street +' '+ district  +' '+  postalCode  +' '+  state  +' '+  country  +' '+  countryCode
        except:
            address="Error"
        return str(address.decode('utf8'))
于 2017-06-07T09:42:53.197 回答
1

不久前我帮助编写了一个名为LiveAddress 的文章;它刚刚升级为支持单行(自由格式)地址并实现地理编码功能。

GeoPy 是一个地理编码实用程序,而不是地址解析器/标准化器。LiveAddress API,但是,也可以为你验证地址的有效性,填写缺失的信息。您会发现像 Google 和 Yahoo 这样的服务会近似地址,而像 LiveAddress 这样的 CASS 认证服务实际上会验证它并且不会返回结果,除非地址是真实的。

在对实现 LiveAddress 进行了大量研究和开发之后,我在这篇 Stack Overflow 帖子中写了一个总结。它记录了一些地址可以输入的疯狂但完整的格式,并最终导致解析问题的解决方案(对于美国地址)。

要使用 Python 将单行地址解析为组件,只需将整个地址放入“street”字段:

import json
import pprint
import urllib

LOCATION = 'https://api.qualifiedaddress.com/street-address/'
QUERY_STRING = urllib.urlencode({ # entire query sting must be URL-Encoded
    'auth-token': r'YOUR_API_KEY_HERE',
    'street': '1 infinite loop cupertino ca 95014'
})
URL = LOCATION + '?' + QUERY_STRING

response = urllib.urlopen(URL).read()
structure = json.loads(response)
pprint.pprint(structure)

生成的 JSON 对象将包含一个components如下所示的对象:

"components": {
        "primary_number": "1",
        "street_name": "Infinite",
        "street_suffix": "Loop",
        "city_name": "Cupertino",
        "state_abbreviation": "CA",
        "zipcode": "95014",
        "plus4_code": "2083",
        "delivery_point": "01",
        "delivery_point_check_digit": "7"
}

响应还将包括组合的 first_line 和 delivery_line_2,因此您无需在需要时手动连接它们。还提供有关地址的纬度/经度和其他信息。

于 2012-07-09T12:40:33.693 回答