我想识别并提取句子中的位置。例如我可能有一句话:
“我喜欢马萨诸塞州波士顿的披萨。” 但同样的句子也可以写成“波士顿的披萨,我喜欢它”。或者“我喜欢波士顿的披萨。”
所以我必须能够在句子的任何地方找到它,如果不包括状态的话。为了使事情变得更加复杂,人们会做 ft. 或 s 之类的事情。对于堡垒或南部,所以我也需要一种方法来识别这些。
我想识别并提取句子中的位置。例如我可能有一句话:
“我喜欢马萨诸塞州波士顿的披萨。” 但同样的句子也可以写成“波士顿的披萨,我喜欢它”。或者“我喜欢波士顿的披萨。”
所以我必须能够在句子的任何地方找到它,如果不包括状态的话。为了使事情变得更加复杂,人们会做 ft. 或 s 之类的事情。对于堡垒或南部,所以我也需要一种方法来识别这些。
我很幸运使用alchemyapi从句子中提取名人姓名 - 您可能想看看他们的实体提取是否能满足您的需求(查看该页面底部的示例,它可能会)。
如何解析句子中的每个单词并检查“位置”字典?命中后,辅助测试可以包括之前/之后的单词,以用相应的城市(之前的单词)或州(之后的单词)来补充位置。
这对于诸如“堪萨斯城最好的布法罗鸡翅”之类的事情会变得很棘手;当您在单个语句中找到多个位置时,您可以使用单独的“双重用途”字典来消除诸如“Buffalo”之类的词。您还可以搜索“in”、“near”、“at”等介词来识别真实位置。