1

我正在寻找任何 NER 模型训练来从说唱歌词中提取实体。目前我正在为 NER 使用 Spacy 模型,但有很多错误分类。这是因为 spacy 模型是对报纸文章进行预训练的。所以,最初的问题;有没有什么模型可以用于说唱歌词的 NER。

这就是当前的 spacy 模型对某些单词进行分类的方式

('kanye west', 'GPE'),('2pac', 'PRODUCT'),('hoochie coochie', 'ORG'),('valley', 'LOC'),('talkin', 'NORP' ),('没什么', 'PERSON'),('100k', '产品')

(如果你想知道这些是什么歌词,这些来自 Kendrick Lamar)

4

1 回答 1

1

您可能需要生成自己的训练数据,因为您尝试分类的词非常特定于美国说唱行业,并且很可能没有包含在任何现有的 nlp 包中。

于 2021-05-18T12:48:26.003 回答