我有一本大约 1500 字的字典。不是所有这 1500 个单词都可以用作文本的主题(其中许多是我字典中的杂音,也许只有 2-10% 可以用作主题),但是我想给文档提供的主题可以是在这 1500 个单词中找到。
因此我应该从哪里开始,什么算法可以工作?谢谢!
我有一本大约 1500 字的字典。不是所有这 1500 个单词都可以用作文本的主题(其中许多是我字典中的杂音,也许只有 2-10% 可以用作主题),但是我想给文档提供的主题可以是在这 1500 个单词中找到。
因此我应该从哪里开始,什么算法可以工作?谢谢!