Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我使用 TextRank 算法对一些文章的句子进行排名。文章中的句子总数从 10 到 71 不等。我想知道是否有任何方法可以确定 k 的值,以选择排名前 k 的句子作为摘要。还是固定为某个数字?
这可能主要取决于您需要多少摘要。换句话说,如果摘要必须符合某些约束条件(例如,400 个字符或更少;至少 50 个单词),那么k满足约束条件的适当设置是什么?相对而言,它类似于 ML 中的超参数优化。
k
此外,质量往往会受到影响。太少的k产量结果可能是无效的。FWIW,我尝试k >= 3一般使用。太大k,结果变得不那么可读。
k >= 3