-2

我想从一个人写的文本中提取个人属性。例如,

我一直对职业自行车很感兴趣。作为一个单身母亲,要找到足够的时间去从事一项专业的运动从来都不是一件容易的事。我能做的最好的事情就是沿着墨尔本美丽的海滩短途骑行......

理想情况下,我想提取像自行车:兴趣,女性:性别,运动:兴趣,墨尔本:位置。我认为这称为命名实体提取,但我不确定。我尝试了斯坦福命名实体识别器,但它并没有给我想要的东西。最重要的是个人属性,例如性别、年龄、兴趣等,而在不同的样本上它错过了大部分。

是否有任何工具/库(最好在 Python 中)可以帮助我做到这一点?我知道 NLTK,但我不知道如何/是否可以在这里使用它。

4

1 回答 1

0

通常,斯坦福命名实体标记器有一些默认分类器,它只有一些通用标记,如'Name','Location','Organizations'. 如果您需要一些其他标记,则必须训练自己的分类器。你可以参考这个来创建新的分类器。我已经创建了自定义模型并且工作正常。

于 2017-10-25T12:06:39.893 回答