我想从一个人写的文本中提取个人属性。例如,
我一直对职业自行车很感兴趣。作为一个单身母亲,要找到足够的时间去从事一项专业的运动从来都不是一件容易的事。我能做的最好的事情就是沿着墨尔本美丽的海滩短途骑行......
理想情况下,我想提取像自行车:兴趣,女性:性别,运动:兴趣,墨尔本:位置。我认为这称为命名实体提取,但我不确定。我尝试了斯坦福命名实体识别器,但它并没有给我想要的东西。最重要的是个人属性,例如性别、年龄、兴趣等,而在不同的样本上它错过了大部分。
是否有任何工具/库(最好在 Python 中)可以帮助我做到这一点?我知道 NLTK,但我不知道如何/是否可以在这里使用它。