我有一个 Python Pandas DataFrame,如下所示:
1
0 a, b
1 c
2 d
3 e
a, b
是表示用户特征列表的字符串
如何将其转换为用户特征的二进制矩阵,如下所示:
a b c d e
0 1 1 0 0 0
1 0 0 1 0 0
2 0 0 0 1 0
3 0 0 0 0 1
我看到了一个类似的问题Creating boolean matrix from one column with pandas但该列不包含列表条目。
我已经尝试过这些方法,有没有办法将两者合并:
pd.get_dummies()
pd.get_dummies(df[1])
a, b c d e
0 1 0 0 0
1 0 1 0 0
2 0 0 1 0
3 0 0 0 1
df[1].apply(lambda x: pd.Series(x.split()))
1
0 a, b
1 c
2 d
3 e
还对创建这种类型的二进制矩阵的不同方法感兴趣!
任何帮助表示赞赏!
谢谢