0

提取相邻单词?(名称、街道、小溪、河流)

嗨,我正在寻找一个功能,我可以通过大量的段落列表来提取“小溪”这个词,以便可以隔离小溪名称。

例如,给定的段落可能是:

“该地点位于距离克拉克溪大桥 3 英里的上游。”</p>

理想的输出将是简单的

克拉克溪

它必须是查找“小溪”这个词作为标准并提取前面的词的东西,即使只是“克拉克”也对我有用。

我一直在玩 RQSlite 包和 gsub,但到目前为止还没有运气……我相信这是一个常见的程序。

4

1 回答 1

1

如果您要提取实际地址,有些服务可以智能地执行此操作,甚至可以验证结果:http ://smartystreets.com/products/liveaddress-api/extract (公平地说,您应该知道我帮助开发了那个,虽然我不再在那里工作。)

对于地名,假设地点只有一个词,您可以尝试一个简单的正则表达式:

/(?<=\s)(\S+\s+(Creek|Street|River))/ig

诚然,我从未使用过 RQSLite 或 gsub,但我想像这样的东西可以解决问题。

于 2013-11-15T15:10:32.363 回答