我正在尝试在 R 中创建用户在世界各个地区的位置热图,但我正在使用的数据集包含一个自由文本位置字段供用户自行填写 - 因此地名的质量差异很大一点点。我可以忽略任何不会解析为已知位置的字符串(这里有足够的好数据供我获取样本),但我似乎无法找到一个容错的地名实体解析器用于R。
另一个问题是,其中一些是城市,其中一些是州,其中一些是国家——理想情况下,我想,我想制作两张地图,一张美国地图,其中所有城市都决心州,以及一张世界地图,其中第一张地图上的所有位置都解析为美国。有没有一种相当简单的方法来做到这一点?
谢谢!