我有一个 Python Pandas DataFrame,如下所示:
      1
0  a, b
1     c
2     d
3     e
a, b是表示用户特征列表的字符串
如何将其转换为用户特征的二进制矩阵,如下所示:
     a    b    c    d    e
0    1    1    0    0    0
1    0    0    1    0    0
2    0    0    0    1    0
3    0    0    0    0    1
我看到了一个类似的问题Creating boolean matrix from one column with pandas但该列不包含列表条目。
我已经尝试过这些方法,有没有办法将两者合并:
pd.get_dummies()
pd.get_dummies(df[1])
   a, b  c  d  e
0     1  0  0  0
1     0  1  0  0
2     0  0  1  0
3     0  0  0  1
df[1].apply(lambda x: pd.Series(x.split()))
      1
0  a, b
1     c
2     d
3     e
还对创建这种类型的二进制矩阵的不同方法感兴趣!
任何帮助表示赞赏!
谢谢