我将“自动文本摘要(语言方法)”作为我最后一年的项目。我已经收集了足够多的研究论文并浏览了它们。我仍然不太清楚“如何去做”的事情。基本上我找到了“AUTOMATIC TEXT SummariZER (statistical based)”,发现它比我的项目要容易得多。我的项目指南告诉我不要选择这个(基于统计的)并选择基于语言的。
任何曾经从事过甚至听说过此类项目的人都会知道,总结任何文档仅意味着对每个句子进行评分(通过某种涉及某些特定算法的方法),然后选择得分超过阈值分数的句子。现在这个项目最困难的部分是选择合适的算法进行评分,然后再实施。
我有中等的编程技能,并且想用 JAVA 编写代码(因为在那里我会得到很多 API,从而减少开销)。现在我想知道对于我的项目,我应该使用什么方法和算法。还有如何实现它们。