397

我不知道如何以通常使用列表的方式使用数组或矩阵。我想创建一个空数组(或矩阵),然后一次添加一列(或行)。

目前我能找到的唯一方法是:

mat = None
for col in columns:
    if mat is None:
        mat = col
    else:
        mat = hstack((mat, col))

而如果它是一个列表,我会做这样的事情:

list = []
for item in data:
    list.append(item)

有没有办法为NumPy数组或矩阵使用这种表示法?

4

15 回答 15

532

您对有效使用 NumPy 有错误的心智模型。NumPy 数组存储在连续的内存块中。如果要向现有数组添加行或列,则需要将整个数组复制到新的内存块中,从而为要存储的新元素创建间隙。如果重复构建数组,这是非常低效的。

在添加行的情况下,最好的办法是创建一个与数据集最终一样大的数组,然后逐行为其分配数据:

>>> import numpy
>>> a = numpy.zeros(shape=(5,2))
>>> a
array([[ 0.,  0.],
   [ 0.,  0.],
   [ 0.,  0.],
   [ 0.,  0.],
   [ 0.,  0.]])
>>> a[0] = [1,2]
>>> a[1] = [2,3]
>>> a
array([[ 1.,  2.],
   [ 2.,  3.],
   [ 0.,  0.],
   [ 0.,  0.],
   [ 0.,  0.]])
于 2009-02-20T10:36:46.047 回答
123

NumPy 数组是与列表非常不同的数据结构,旨在以不同的方式使用。您的使用hstack可能非常低效......每次调用它时,现有数组中的所有数据都会被复制到一个新数组中。(这个append函数也会有同样的问题。)如果你想一次建立你的矩阵一列,你最好把它保存在一个列表中,直到它完成,然后才将它转换成一个数组。

例如


mylist = []
for item in data:
    mylist.append(item)
mat = numpy.array(mylist)

item可以是列表、数组或任何可迭代的,只要每个item具有相同数量的元素。
在这种特殊情况下(data是一些可迭代的保存矩阵列),您可以简单地使用


mat = numpy.array(data)

(另请注意,list用作变量名可能不是一个好习惯,因为它会用该名称掩盖内置类型,这可能会导致错误。)

编辑:

如果出于某种原因您确实想创建一个空数组,则可以使用 numpy.array([]),但这很少有用!

于 2009-02-20T10:44:19.947 回答
75

要在 NumPy 中创建一个空的多维数组(例如,一个 2D 数组m*n来存储您的矩阵),以防您不知道m要追加多少行并且不关心 Stephen Simmons 提到的计算成本(即重新构建每个追加的数组),您可以将要追加到的维度压缩到 0: X = np.empty(shape=[0, n])

例如,您可以使用这种方式(在这里m = 5我们假设我们在创建空矩阵时不知道,并且n = 2):

import numpy as np

n = 2
X = np.empty(shape=[0, n])

for i in range(5):
    for j  in range(2):
        X = np.append(X, [[i, j]], axis=0)

print X

这会给你:

[[ 0.  0.]
 [ 0.  1.]
 [ 1.  0.]
 [ 1.  1.]
 [ 2.  0.]
 [ 2.  1.]
 [ 3.  0.]
 [ 3.  1.]
 [ 4.  0.]
 [ 4.  1.]]
于 2014-04-10T04:34:58.840 回答
28

我对此进行了很多研究,因为我需要在我的一个学校项目中使用 numpy.array 作为一个集合,并且我需要初始化为空......我在 Stack Overflow 上没有找到任何相关答案,所以我开始了涂鸦的东西。

# Initialize your variable as an empty list first
In [32]: x=[]
# and now cast it as a numpy ndarray
In [33]: x=np.array(x)

结果将是:

In [34]: x
Out[34]: array([], dtype=float64)

因此,您可以直接初始化一个 np 数组,如下所示:

In [36]: x= np.array([], dtype=np.float64)

我希望这有帮助。

于 2013-04-10T12:39:58.700 回答
10

您可以使用附加功能。对于行:

>>> from numpy import *
>>> a = array([10,20,30])
>>> append(a, [[1,2,3]], axis=0)
array([[10, 20, 30],      
       [1, 2, 3]])

对于列:

>>> append(a, [[15],[15]], axis=1)
array([[10, 20, 30, 15],      
       [1, 2, 3, 15]])

编辑
当然,正如其他答案中所提到的,除非您每次都在矩阵/数组上进行一些处理(例如反转),否则我只会创建一个列表,附加到它然后将其转换为大批。

于 2009-02-20T10:27:31.797 回答
5

这是使 numpys 看起来更像列表的一些解决方法

np_arr = np.array([])
np_arr = np.append(np_arr , 2)
np_arr = np.append(np_arr , 24)
print(np_arr)

输出:数组([2., 24.])

于 2020-02-05T08:41:38.503 回答
5

要创建一个空的 NumPy 数组而不定义其形状,您可以执行以下操作:

arr = np.array([])

第一个是首选,因为您知道您将使用它作为 NumPy 数组。NumPynp.ndarray之后将其转换为类型,无需额外[]的“维度”。

为了向数组添加新元素,我们可以这样做:

arr = np.append(arr, 'new element')

请注意,在 python 的背景中,没有定义其形状的数组是不存在的。正如@hpaulj 提到的,这也构成了一个单秩数组。

于 2020-04-14T06:23:31.393 回答
3

如果您绝对不知道数组的最终大小,可以像这样增加数组的大小:

my_arr = numpy.zeros((0,5))
for i in range(3):
    my_arr=numpy.concatenate( ( my_arr, numpy.ones((1,5)) ) )
print(my_arr)

[[ 1.  1.  1.  1.  1.]  [ 1.  1.  1.  1.  1.]  [ 1.  1.  1.  1.  1.]]
  • 注意0第一行中的。
  • numpy.append是另一种选择。它调用numpy.concatenate.
于 2011-09-06T21:20:44.693 回答
3

您可以应用它来构建任何类型的数组,例如零:

a = range(5)
a = [i*0 for i in a]
print a 
[0, 0, 0, 0, 0]
于 2015-10-01T17:50:36.103 回答
2

根据您使用它的目的,您可能需要指定数据类型(参见'dtype')。

例如,要创建一个 8 位值的二维数组(适合用作单色图像):

myarray = numpy.empty(shape=(H,W),dtype='u1')

对于 RGB 图像,在形状中包含颜色通道的数量:shape=(H,W,3)

您可能还需要考虑使用numpy.zeros而不是使用 进行零初始化numpy.empty请参阅此处的注释。

于 2016-09-11T00:28:42.980 回答
2

另一种创建可以接受数组的空数组的简单方法是:

import numpy as np
np.empty((2,3), dtype=object)
于 2021-03-11T07:11:00.920 回答
1

我认为您想使用列表处理大部分工作,然后将结果用作矩阵。也许这是一种方式;

ur_list = []
for col in columns:
    ur_list.append(list(col))

mat = np.matrix(ur_list)
于 2018-10-09T06:43:11.327 回答
1

我认为您可以创建空的 numpy 数组,例如:

>>> import numpy as np
>>> empty_array= np.zeros(0)
>>> empty_array
array([], dtype=float64)
>>> empty_array.shape
(0,)

当您想在循环中附加 numpy 数组时,此格式很有用。

于 2019-08-30T13:47:41.997 回答
0

也许您正在寻找的是这样的:

x=np.array(0)

通过这种方式,您可以创建一个没有任何元素的数组。它类似于:

x=[]

这样您就可以提前将新元素附加到您的数组中。

于 2020-06-19T23:38:01.083 回答
0

最简单的方法

输入:

import numpy as np
data = np.zeros((0, 0), dtype=float)   # (rows,cols)
data.shape

输出:
(0, 0)

输入:

for i in range(n_files):
     data = np.append(data, new_data, axis = 0)
于 2021-05-20T16:33:58.127 回答