我是文本挖掘和 NLP 的新手。我正在尝试使用命名实体识别 (NER) (Stanford Named Entity Tagger) 从给定文本中提取日期。我正在使用斯坦福 NLP http://nlp.stanford.edu:8080/ner/process和 GATE ANNIE http://services.gate.ac.uk/annie/提供的在线演示
此演示无法将完整的“上周日”、“下周一”、“本月末”“直到本周日晚上”等文本识别为日期。仅星期日或星期一对确定日期没有用处。是否有任何选项可以提取给定示例文本提到的实际文本?
示例文本:
使用 Puma 犒劳自己,因为它提供 Flat 50% 折扣。快点优惠有效期至本周日。开心购物。
提取日期:25-08-2013(考虑到今天是 19-08-2013。日期格式可以是任何东西)
任何库都提供这种日期识别功能,或者是否可以构建自定义模型来识别示例文本中给出的日期?