python - 使用 NLTK 检测英语动词时态

Question

我正在寻找一种方法，在过去、现在和将来时态中给定英文文本计数动词短语。现在我正在使用NLTK，做一个 POS (Part-Of-Speech) 标记，然后数说 'VBD' 来获得过去时态。不过这还不够准确，所以我想我需要更进一步并使用分块，然后分析 VP-chunks 的特定时态模式。有什么存在的吗？任何可能有帮助的进一步阅读？NLTK 书主要关注 NP-chunks，我可以找到很少的关于 VP-chunks 的信息。

score 10 · Accepted Answer

确切的答案取决于您打算使用哪个分块器，但列表推导式会让您走很长一段路。这可以让您使用不存在的分块器获得动词短语的数量。

len([phrase for phrase in nltk.Chunker(sentence) if phrase[1] == 'VP'])

您可以采用更细粒度的方法来检测时态的数量。

score 1 · Accepted Answer

您可以使用Berkeley Parser或Stanford Parser来做到这一点。但我不知道是否有可用的 Python 接口。

python - 使用 NLTK 检测英语动词时态

2 回答 2

Related

Reference