我有一个包含数百万美国地址的数据集。我想对这个数据集进行地理编码。雅虎有一个 API 具有最慷慨的速率限制(每天 50K,对于我的目的来说仍然太低),但这已经不复存在了。我不认为任何 API,除非我每天可以处理超过 10 万个请求,才能满足我的需求。
我可以从自己的计算机上下载任何易于配置的软件来执行此操作吗?
特别是对于那些有经验的人, http: //www.datasciencetoolkit.org/developerdocs#setup 是否 适合我的需求?
每天支持数百万个请求的 API 是否适合您的需求?
很少有服务可以做到这一点。特别是SmartyStreets的 LiveAddress 可以处理这种负载,并且实际上是为它构建的。您可以上传文件(如 Excel 或 CSV 等,尤其是压缩文件,如果您有那么多)或查询 API(每个请求可以支持 100 个地址)。
因此,虽然程序不会下载到您的计算机上,但它实际上会比本地化的内部解决方案更快,因为它会在负载高时进行扩展。LiveAddress 是地理分布的,由 RAM 驱动服务器提供支持,当有大量工作要做时,这些服务器会启动更多节点。LiveAddress 以快速处理数百万个地址而闻名(例如在几个小时内)。
我在 SmartyStreets 工作。我们敢于让您看看您可以多快合法地查询 API 或上传和处理您的所有列表。GitHub 上有大量API 示例代码,或者您可以(以编程方式或手动)上传列表文件以进行批量地理编码。