9

已经做了哪些工作来确定特定字符串是否与地理位置有关?例如:

'troy, ny'
'austin, texas'
'hotels in las vegas, nv'

我想我有点期待的是一种统计方法,它可以在一定程度上确定前两个是位置。最后一个可能需要一个启发式方法来抓取“%s,%s”,然后使用相同的技术。我特别在寻找不太依赖“in”命题的方法,因为它不是一个完全明确或始终可用的位置指标。

谁能指出我的方法、论文或现有的实用程序?谢谢!

4

4 回答 4

8

您描述的问题通常称为地理查询解析或更一般地称为地理信息检索。

在 CLEF 2007 ( http://www.uni-hildesheim.de/geoclef/2007/Query-Parsing.htm ) 上有一项最近的任务。获胜的团队使用了基于规则的语法,这与您可能不想要的相似。www2009 上的另一篇论文谈到了 GeoParser: http ://www2009.eprints.org/239/ 。

CIKM 2007 上也有一些关于地理信息检索的论文:http ://www.geo.unizh.ch/~rsp/gir07/accepted.html

我不知道有什么开源软件可以做到这一点,但它可能会被捆绑到像 Lemur 这样的搜索引擎中。

于 2009-07-29T19:08:18.180 回答
4

Everyblock.com 采用了一种非常有趣的方法,专注于用英语表达位置的方式——它们基本上使用了一些复杂而广泛的正则表达式,这些表达式现在是开源的。他们的应用程序旨在扫描新闻文章、评论和各种公共数据源,并将它们与特定位置相关联,并且运行良好。诸如“旧金山 20 号东北角和瓦伦西亚街的建筑物发生火灾”之类的表达非常准确地进行了地理编码。你可以在这里研究源码。您可能想要的特定部分ebpub/ebpub/geocoder/base.py位于ebpub下载中,以及它周围的所有内容,例如从 SmartGeocoder 类开始并向后工作。

于 2009-07-31T00:09:05.513 回答
3

帮助链接:geonames.org 搜索

以 xml 或 json 文档的形式返回为搜索词找到的名称

例如:http ://ws.geonames.org/search?q=troy,%20ny&maxRows=10

于 2009-07-29T15:25:42.933 回答
0

我正在 geocode.xyz 构建一个免费的地理解析器

(currently supports about 50 European countries, soon to offer global coverage)

A sample application of geoparsing can be found on OpenWikiMap

于 2016-07-21T17:18:52.817 回答