我的数据框包含一列 ID 和一列主题。最终,我想按主题对我的数据进行聚类,这样我就可以看到按主题聚类的 ID 组。
为了做到这一点,我希望将我的数据框作为每个 ID 一行,每个主题一列包含 1 或 0 值,以指示该主题是否由该行上的 ID 获取。
输入示例:
ID Subject
John History
John English
Jane Maths
Jane Science
Jane History
Mark History
Mark Science
Mark Mathematics
预期输出:
Subject English History Mathematics Maths Science
ID
Jane 0 1 0 1 1
John 1 1 0 0 0
Mark 0 1 1 0 1