nlp - 自然语言处理中特征工程的最佳方法？

翻译自：https://stackoverflow.com/questions/57356130 2019-08-05T09:52:04.493

31 次

我正在尝试对大量文档进行聚类，并希望随后根据每个聚类中最常见的共享关键字或关键短语来解释每个聚类的特征。为了使聚类可行，我将使用降维方法，例如 LSA (SVD) 或 doc2vec。

我可以看到几个可能的降维特征矩阵的路径：

这些以及其他方法的优点和缺点是什么？最终最好的方法是什么？

0 回答 0