2

我正在使用 geopy 来获取城市名称的纬度 - 经度对。对于单个查询,这很好用。我现在尝试做的是遍历大量城市名称(46.000)并获取每个城市的地理编码。之后,我通过一个检查循环运行它们,该循环将城市(如果它在美国)分类到正确的州。我的问题是,我一直收到“GeocoderTimedOut('Service timed out')”,一切都很慢,我不确定这是我的错还是只是地理性质。这是负责的代码片段:

for tweetcount in range(number_of_tweets):

#Get the city name from the tweet
city = data_dict[0]['tweetList'][tweetcount]['user']['location']

#Sort out useless tweets
if(len(city)>3 and not(city is None)): 

    # THE RESPONSIBLE LINE, here the error occurs
    location = geolocator.geocode(city);

    # Here the sorting into the state takes place
    if location is not None:
        for statecount in range(len(data)):
            if point_in_poly(location.longitude, location.latitude, data[statecount]['geometry']):

                state_tweets[statecount] += 1;
                break;

不知何故,这一行每隔 2./3 就会抛出一次超时。称呼。City 有“Manchester”、“New York, New York”或类似的形式。我已经尝试过 - 除了所有东西周围的块,但这并没有真正改变问题的任何内容,所以我现在删除了它们......任何想法都会很棒!

4

2 回答 2

2

您将受制于您使用的任何地理定位器服务。geopy只是不同 Web 服务的包装器,因此如果服务器忙,可能会失败。我会围绕geolocator.geocode调用创建一个包装器,如下所示:

def geocode(city, recursion=0):
    try:
        return geolocator.geocode(city)
    except GeocoderTimedOut as e:
        if recursion > 10:      # max recursions
            raise e

        time.sleep(1) # wait a bit
        # try again
        return geocode(city, recursion=recursion + 1)

这将在延迟 1 秒后重试 10 次。根据您的喜好调整这些数字。

如果你重复要求同一个城市,你应该考虑将它包装在某种记忆中,例如这个装饰器。由于您尚未发布可运行的代码,因此我无法对此进行测试。

于 2016-05-18T15:04:41.480 回答
1

你应该改变你的线路:

location = geolocator.geocode(city);

location = geolocator.geocode(city,timeout=None);
于 2019-02-14T11:25:24.557 回答