我正在尝试使用 NLTK 命名实体标记器来识别各种命名实体。在《Natural Language Processing with Python 》一书中,他们提供了常用命名实体的列表(表 7.4,如果有人好奇的话),其中包括:DATE June, 2008-06-29 和 TIME 25 am, 1:30 pm 所以我得到的印象是这可以用 NLTK 的命名实体标记器来完成。
但是,当我运行标记器时,它似乎根本没有选择日期或时间,就像人或组织一样。NLTK 命名实体标记器是否不处理这些日期/时间情况,还是只选择特定的日期/时间格式?如果它不处理这些情况,是否有人知道可以处理的系统?还是创建我自己的唯一解决方案?
谢谢!