Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想比较 TF-IDF、Vector 模型和 TF-IDF 算法的一些优化。为此,我需要一个数据集(至少 100 个英文文本文档)。我找不到一个。有什么建议么 ?
这取决于您使用 TF-IDF 的应用程序。例如,如果您想查找关键字,您可以使用“Mendely”数据集或使用“Delicious”数据进行标记。