1

我正在尝试将三个一维数组转换为二维数组列表。我设法通过创建一个空的 ndarray 并逐行填充它来做到这一点。有人可以告诉我一个更优雅的方法吗?

import numpy as np
import pandas as pd
one=np.arange(1,4,1)
two=np.arange(10,40,10)
three=np.arange(100,400,100)
df=pd.DataFrame({'col1':one,'col2':two,'col3':three})

desired_output=[np.array([[1.,10.],[1.,100.]]),np.array([[2.,20.],[2.,200.]]),np.array([[3.,30.],[3.,300.]])]

当前有效的不雅方法:

output=[]
for i in range(len(df)):
    temp=np.zeros(shape=(2,2))
    temp[0][0]=df.iloc[i,0]
    temp[0][1]=df.iloc[i,1]
    temp[1][0]=df.iloc[i,0]
    temp[1][1]=df.iloc[i,2]
    output.append(temp)
4

2 回答 2

2

所以首先你可以df通过简单地执行以下操作从值中获取数组

In [61]:
arr = df.values
arr
Out[61]:
array([[  1,  10, 100],
       [  2,  20, 200],
       [  3,  30, 300]])

然后再次添加数组中的第一列

In [73]:
arr_mod = np.hstack((arr , arr[: , 0][:, np.newaxis]))
arr_mod
Out[73]:
array([[  1,  10, 100,   1],
       [  2,  20, 200,   2],
       [  3,  30, 300,   3]])

将您刚刚添加的列与数组中的最后一列交换

In [74]:
arr_mod[: , [2 , 3]] = arr_mod [:  , [3 , 2]]
arr_mod
Out[74]:
array([[  1,  10,   1, 100],
       [  2,  20,   2, 200],
       [  3,  30,   3, 300]])

然后将此 2d 转换array为 3darray并将其转换为列表

In [78]:
list(arr_mod.reshape( -1, 2 , 2))
Out[78]:
[array([[  1,  10],
        [  1, 100]]), array([[  2,  20],
        [  2, 200]]), array([[  3,  30],
        [  3, 300]])]
于 2015-11-22T13:03:58.387 回答
1

np.column_stack这是使用和的一种方法np.vsplit-

arr2D = np.column_stack((df['col1'],df['col2'],df['col1'],df['col3']))
out_list = np.vsplit(arr2D.reshape(-1,2),arr2D.shape[0])

基本上,我们使用np.column_stackstack column-1withcolumn-2然后再次column-1withcolumn-3给我们一个arr2Dshape的 2D NumPy 数组N x 4。接下来,我们重塑arr2D为一个2*N X 2数组并沿行拆分,np.vsplit以提供预期的2D数组列表。

样品运行 -

>>> df
   col1  col2  col3
0     1    10   100
1     2    20   200
2     3    30   300
3     4    40   400
4     5    50   500
5     6    60   600
>>> arr2D = np.column_stack((df['col1'],df['col2'],df['col1'],df['col3']))
>>> out_list = np.vsplit(arr2D.reshape(-1,2),arr2D.shape[0])
>>> print out_list
[array([[  1,  10],
       [  1, 100]]), array([[  2,  20],
       [  2, 200]]), array([[  3,  30],
       [  3, 300]]), array([[  4,  40],
       [  4, 400]]), array([[  5,  50],
       [  5, 500]]), array([[  6,  60],
       [  6, 600]])]
于 2015-11-22T13:31:47.533 回答