我想从我的文本中提取关键字。我的文章必须是与音乐、体育、农业等相关的任何类型。所以我想要的是从段落中提取关键字。我想用 Java 做这件事,我搜索了很多,但找不到任何好的算法或程序来做这件事。
经过搜索,我发现python中有关键字提取算法。但我需要在 Java 中执行此操作。我目前所做的是
1)Divided a paragraph into sentences.
2)Removed stop-words
3)calculated word frequency of each sentence.
但问题是我们不能说词频最大的句子就是主句。我也打算做总结器来从段落中提取主要句子。现在我完全被这个困住了。任何人都可以帮助我。任何帮助将不胜感激。