1

我正在为 Offer Drive 产品 ( http://offerletter.io/drive.html )追溯清理一堆数据。我正在尝试规范化一个自由格式的“位置”字段,以确定提交的位置是否在美国(或不在)。

值可能在粒度上有所不同,但都是“真实的”,例如

San Francisco, CA Milwaukee Bangalore 我的问题是,有没有一种好方法(一些 API 或库)可以根据用户提交的字符串智能地标准化这些,这样我可以说:

normalized = GeoNormalize.normalize("San Francisco")
return normalized.country() == "United States"

我真的很喜欢chronykhttps://github.com/KoffeinFlummi/Chronyk),这样的地点会很棒。

4

2 回答 2

2

有很多,通常由制图或 GIS 供应商提供。

例如,谷歌地理编码服务接受一个字符串并以标准格式返回一组排名的位置:

https://developers.google.com/maps/documentation/geocoding/?csw=1#Geocoding

雅虎也有一个:

https://developer.yahoo.com/boss/geo/#overview

就像我说的,有很多很多。它们通常免费用于少量使用,但在一定时间后会产生使用费。

于 2015-06-05T01:24:31.733 回答
1

尝试地理

如果您使用 python 3.x 并在安装过程中遇到问题,请尝试:

    python3 -m pip3 install git+https://github.com/reach2ashish/geograpy.git
    python3 geograpy-nltk
于 2018-10-25T08:34:16.573 回答