2

我想编写一个解析器,在大量文本中搜索一些城市名称或其他地理主题。例如Sydney,, ... Tower Bridge_Munich

我的想法是向本地数据库请求一些带有地理信息的单词(例如http://www.geonames.org/,我可以在那里下载一些城市信息),如果有命中,数据库会响应一些 lan 和 lon 坐标。单词必须以大写字母开头并且长度必须>2

但我认为表现非常糟糕。一篇文章包含 10 到 100 个单词。有没有更好的方法来查找有关文本的地理信息?

也许有一个更好的数据库,包含更多的地理信息?

问候,命运

4

2 回答 2

1

您可能希望使用诸如Lucene之类的库来索引文本文件,然后搜索列表中的每个城市。结果将为您提供文件名和术语的位置(带有周围的文本片段)

于 2012-07-12T15:22:08.910 回答
0

也许尝试使用谷歌 JSON API:搜索 Baltimore MD

于 2012-07-12T15:25:41.113 回答