对地名数据进行位置消歧的最佳方法是什么?
地名搜索有一些评分算法,但他们不开源,我不确定它们是否非常复杂。(即soma, ca
它返回Soma lake in Canada
甚至没有维基百科的文章,而不是非常流行Soma Neirbohood in san francisco
)
我在谷歌学者中也找到了一些作品,但它们似乎很肤浅,与我的启发式相似,比如用某物(log(population) + 1000*hasWikipedia(article)+ isCity100+isCapital(10)
)评分。
我的旅游文章领域,所以我的评分功能应该提供最可能的旅游地点(城市、名胜古迹(迪斯尼乐园、Colleseum、大本钟))。
你知道这个领域的任何重要文章,或者谷歌地图、雅虎、必应甚至地名在生产中使用的算法吗?