8

我有一个有 100 万行和 5 列的 pandas Dataframe y。

np.shape(y)  
(1037889, 5)

列值都是 0 或 1。看起来像这样:

y.head()  
a, b, c, d, e  
0, 0, 1, 0, 0  
1, 0, 0, 1, 1  
0, 1, 1, 1, 1  
0, 0, 0, 0, 0

我想要一个有 100 万行和 1 列的数据框。

np.shape(y)  
(1037889, )

其中列只是连接在一起的 5 列。

New column  
0, 0, 1, 0, 0  
1, 0, 0, 1, 1  
0, 1, 1, 1, 1  
0, 0, 0, 0, 0

我一直在尝试不同的东西,比如merge, concat, dstack, 等等......但似乎无法弄清楚这一点。

4

1 回答 1

11

如果您希望新列将所有数据连接到字符串,那么 apply() 函数是一个很好的例子:

>>> df = pd.DataFrame({'a':[0,1,0,0], 'b':[0,0,1,0], 'c':[1,0,1,0], 'd':[0,1,1,0], 'c':[0,1,1,0]})
>>> df
   a  b  c  d
0  0  0  0  0
1  1  0  1  1
2  0  1  1  1
3  0  0  0  0
>>> df2 = df.apply(lambda row: ','.join(map(str, row)), axis=1)
>>> df2
0    0,0,0,0
1    1,0,1,1
2    0,1,1,1
3    0,0,0,0
于 2013-10-30T06:23:05.393 回答