我正在寻找任何 NER 模型训练来从说唱歌词中提取实体。目前我正在为 NER 使用 Spacy 模型,但有很多错误分类。这是因为 spacy 模型是对报纸文章进行预训练的。所以,最初的问题;有没有什么模型可以用于说唱歌词的 NER。
这就是当前的 spacy 模型对某些单词进行分类的方式
('kanye west', 'GPE'),('2pac', 'PRODUCT'),('hoochie coochie', 'ORG'),('valley', 'LOC'),('talkin', 'NORP' ),('没什么', 'PERSON'),('100k', '产品')
(如果你想知道这些是什么歌词,这些来自 Kendrick Lamar)