最近我研究了图像聚类,它找到了相似的图像并将它们组合在一起。我使用 python 的skimage模块来计算 SSIM,然后根据确定的某个阈值对所有图像进行聚类。
我想对文本做类似的事情。我想创建包含类似文本的自动集群。例如,cluster-1 可以包含所有代表工作母亲的文本,cluster-2 可以包含所有代表人们谈论食物的文本等等。我知道这必须是无监督学习。我们是否有类似的 python 模块可以帮助完成这项任务?我还查看了 google 的 tensorflow,看看我是否可以从中得到一些东西,但在其文档中没有找到任何与文本聚类相关的内容。