python - 歌词的NER模型[说唱]

Question

我正在寻找任何 NER 模型训练来从说唱歌词中提取实体。目前我正在为 NER 使用 Spacy 模型，但有很多错误分类。这是因为 spacy 模型是对报纸文章进行预训练的。所以，最初的问题；有没有什么模型可以用于说唱歌词的 NER。

这就是当前的 spacy 模型对某些单词进行分类的方式

('kanye west', 'GPE'),('2pac', 'PRODUCT'),('hoochie coochie', 'ORG'),('valley', 'LOC'),('talkin', 'NORP' ),('没什么', 'PERSON'),('100k', '产品')

（如果你想知道这些是什么歌词，这些来自 Kendrick Lamar）

score 1 · Accepted Answer

您可能需要生成自己的训练数据，因为您尝试分类的词非常特定于美国说唱行业，并且很可能没有包含在任何现有的 nlp 包中。

1 回答 1