我正在为 Offer Drive 产品 ( http://offerletter.io/drive.html )追溯清理一堆数据。我正在尝试规范化一个自由格式的“位置”字段,以确定提交的位置是否在美国(或不在)。
值可能在粒度上有所不同,但都是“真实的”,例如
San Francisco, CA
Milwaukee
Bangalore
我的问题是,有没有一种好方法(一些 API 或库)可以根据用户提交的字符串智能地标准化这些,这样我可以说:
normalized = GeoNormalize.normalize("San Francisco")
return normalized.country() == "United States"
我真的很喜欢chronyk
(https://github.com/KoffeinFlummi/Chronyk),这样的地点会很棒。