有很多分类广告以非 HTML 格式(纸张、文本、书面等)出现,倾向于出售房屋、汽车、出租、租赁、平面等。例如,分类广告说,公寓租金广告具有一些特征,例如:尺寸、面积、位置、价格、联系信息。。ETC
我的问题是如何提取广告所在的街道地址(文章/LOCALITY中提到的地址)或在前一篇文章中提到的?
有没有使用 NLTK & python 解决这个问题的方法?假设文章的来源是普通文本文件(.txt)。
有很多分类广告以非 HTML 格式(纸张、文本、书面等)出现,倾向于出售房屋、汽车、出租、租赁、平面等。例如,分类广告说,公寓租金广告具有一些特征,例如:尺寸、面积、位置、价格、联系信息。。ETC
我的问题是如何提取广告所在的街道地址(文章/LOCALITY中提到的地址)或在前一篇文章中提到的?
有没有使用 NLTK & python 解决这个问题的方法?假设文章的来源是普通文本文件(.txt)。