我搜索了提取和抽象摘要方法。由于抽象摘要的许多缺点,我想做推理摘要。我希望能够使用监督学习方法进行推理摘要。在我对提取摘要的研究中,我总是遇到TextRank 算法,但这是一种无监督学习方法。我希望能够使用监督学习方法总结推理。可能吗?我可以在包含 15000 个数据的数据集上运行 TextRank(例如)吗?
下面给出的代码不应被考虑在内。不相关的代码共享问题。
word_embeddings = {}
f = open('/content/drive/MyDrive/MetinAnalizi/glove.6B.100d.txt', encoding='utf-8')
for line in f:
values = line.split()
word = values[0]
coefs = np.asarray(values[1:], dtype='float32')
word_embeddings[word] = coefs
f.close()
sim_mat = np.zeros([len(sentences), len(sentences)])
from sklearn.metrics.pairwise import cosine_similarity
for i in range(len(sentences)):
for j in range(len(sentences)):
if i != j:
sim_mat[i][j] = cosine_similarity(sentence_vectors[i].reshape(1,100), sentence_vectors[j].reshape(1,100))[0,0]