4

我创建了一个 numpy 数组,数组的每个元素都包含一个相同形状的数组(9,5)。我想要的是一个 3D 数组。

我试过使用 np.stack。

data = list(map(lambda x: getKmers(x, 9), data)) # getKmers creates a       
                                                 # list of list from a pandas dataframe
data1D = np.array(data)                          # shape (350,)
data2D = np.stack(data1D)

data1D:
array([list([      pdbID  AtomNo Type      Eta    Theta
0  1a9l.pdb     2.0    G  169.225  212.838
1  1a9l.pdb     3.0    G  168.439  206.785
2  1a9l.pdb     4.0    U  170.892  205.845
3  1a9l.pdb     5.0    G  164.726  225.982
4  1a9l.pdb     6.0    A  308.788  144.370
5  1a9l.pdb     7.0    C  185.211  209.363
6  1a9l.pdb     8.0    U  167.612  216.614
7  1a9l.pdb     9.0    C  168.741  219.239
8  1a9l.pdb    10.0    C  163.639  207.044,       pdbID  AtomNo Type          Eta    Theta
1  1a9l.pdb     3.0    G  168.439  206.785
2  1a9l.pdb     4.0    U  170.892  205.845
3  1a9l.pdb     5.0    G  164.726  225.982
4  1a9l.pdb     6.0    A  308.788  144.370
5  1a9l.pdb     7.0    C  185.211  209.363
6  1a9l.pdb     8.0    U  167.612  216.614
7  1a9l.pdb     9.0    C  168.741  219.239
8  1a9l.pdb    10.0    C  163.639  207.044

我收到此错误:无法将大小为 9 的序列复制到维度为 5 的数组轴

我想创建一个 3D 矩阵,其中每个子数组都在新的 3D 维度中。我猜新的形状是 (9,5,350)

4

3 回答 3

6

你需要使用

 data.reshape((data.shape[0], data.shape[1], 1))

例子

from numpy import array
data = [[11, 22],
    [33, 44],
    [55, 66]]
data = array(data)
print(data.shape)
data = data.reshape((data.shape[0], data.shape[1], 1))
print(data.shape)

运行示例首先打印 2D 数组中每个维度的大小,重新调整数组的形状,然后汇总新 3D 数组的形状。

结果

(3,2)
(3,2,1)

来源:https ://machinelearningmastery.com/index-slice-reshape-numpy-arrays-machine-learning-python/

于 2019-06-17T16:02:54.563 回答
1

如果您想创建一个 3D 矩阵,其中每个子数组都在新的 3D 维度中,那么最终的形状不是(350,9,5)吗?在这种情况下,您可以简单地使用:

new_array = np.asarray(data).reshape(350,9,5)
于 2019-06-17T20:53:47.403 回答
1

从您的问题看来, getKmers(x, 9) 生成了一个包含 9 个长度为 350 个列表的列表,并且data输入有 5 个元素。你想要一个 (9, 5, 350) 数组。这应该可以通过以下方式实现:

arr = np.swapaxes([getKermers(x, 9) for x in data], 0, 1)

请注意,swapaxes这与重塑不同。如果您只是这样做np.array([getKermers(x, 9) for x in data]).reshape(9, 5, 350),您最终会得到所需的输出形状,但您的数据顺序错误。

于 2019-06-17T21:35:49.213 回答