Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在做一个从短文本(3-4 个句子)中提取关键字的项目。使用spaCy库我提取名词短语和 NER 并将它们用作关键字。但是,我想根据它们对原始文本的重要性对它们进行排序。
spaCy
我尝试了标准的信息检索方法,例如tfidf,甚至是一些基于图形的算法,但是文本如此短,结果并不是那么好。
tfidf
我在想也许使用带有注意力机制的神经网络可以帮助我对这些关键词进行排名。有没有办法使用 spaCy 附带的预训练模型进行某种排名?
诸如最大边际相关性之类的东西怎么样?http://www.cs.cmu.edu/~jgc/publication/The_Use_MMR_Diversity_Based_LTMIR_1998.pdf