我正在尝试使用 NLTK 工具包从短信中提取地点、日期和时间。我刚刚在我的机器上安装了工具包,我写了这个快速代码片段来测试它:
sentence = "Let's meet tomorrow at 9 pm";
tokens = nltk.word_tokenize(sentence)
pos_tags = nltk.pos_tag(tokens)
print nltk.ne_chunk(pos_tags, binary=True)
我假设它将识别日期(明天)和时间(晚上 9 点)。但是,令人惊讶的是,它没有意识到这一点。当我运行上面的代码时,我得到以下结果:
(S (GPE Let/NNP) 's/POS meet/NN tomorrow/NN at/IN 9/CD pm/NN)
有人可以帮助我了解我是否遗漏了什么,或者 NLTK 还不够成熟,无法正确标记时间和日期。谢谢!