Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想使用 20 个新闻组数据集来测试一个算法,并分析每个组的重要词。
在多伦多大学提供的网站上。但是我找不到这个数据集对应的词汇文件。那么有没有其他人可以给我一盏灯?
您可以在这里尝试20 个新闻组数据集。它还包括一个词汇文件,但它可能与您拥有的文件不一致,因此使用那里的所有文件可能会有所帮助。
希望这可以帮助!