0

我想使用 20 个新闻组数据集来测试一个算法,并分析每个组的重要词。

在多伦多大学提供的网站上。但是我找不到这个数据集对应的词汇文件。那么有没有其他人可以给我一盏灯?

4

1 回答 1

0

您可以在这里尝试20 个新闻组数据集。它还包括一个词汇文件,但它可能与您拥有的文件不一致,因此使用那里的所有文件可能会有所帮助。

希望这可以帮助!

于 2014-12-03T05:16:47.620 回答