我正在尝试对技术流程进行聚类。在我的数据集中,我有很多文本数据,我已经使用 TF-IDF 和 k-means 对其进行了聚类。现在我还想使用其他一些功能,例如部门名称(分类名称)和日期(或流程的天数)。
我对如何做到这一点有点困惑。我可以只制作一个包含所有功能的矩阵(用于描述的 TF-IDF 矩阵 + 部门(每个部门使用一个独特的数字)+ 持续时间的天数)?
我会感谢任何建议
我正在尝试对技术流程进行聚类。在我的数据集中,我有很多文本数据,我已经使用 TF-IDF 和 k-means 对其进行了聚类。现在我还想使用其他一些功能,例如部门名称(分类名称)和日期(或流程的天数)。
我对如何做到这一点有点困惑。我可以只制作一个包含所有功能的矩阵(用于描述的 TF-IDF 矩阵 + 部门(每个部门使用一个独特的数字)+ 持续时间的天数)?
我会感谢任何建议