2

假设我有一个看起来像这样的二维 NumPy 数组,我想提取左下角的正方形(4x4):

arr_2d = [[ 5,10,15],
          [20,25,30],
          [35,40,45]]

为什么这种方式有区别:

arr_2d[row,col]

这样:

arr_2d[row][col]

我说这是有区别的,因为我在尝试这样做时得到了不同的输出:

arr_2d[1:3,1:3] #output was: [[25,30],
                              [40,45]]

arr_2d[1:3][1:3] #output was: [[35, 40, 45]]

如果我的问题错了,你能告诉我为什么吗?

提前致谢!

4

3 回答 3

4

假设arr_2d被声明为 numpy 数组:

import numpy as np
arr_2d = np.array([[5, 10, 15],
                   [20, 25, 30],
                   [35, 40, 45]])

然后,arr_2d[1:3, 1:3]将从每个维度返回具有元素 1 和 2 的子矩阵(注意 Python 从 0 开始索引)。

arr_2d[1:3][1:3]被解释为索引两次:

  • 首先arr_2d[1:3]需要第 1 行和第 2 行:rows_1_2 = np.array([[20, 25, 30], [35, 40, 45]])

  • 然后,该结果再次用 索引[1:3],因此rows_1_2[1:3]将给出 的第 1 行和第 2 行rows_1_2。由于该数组中不存在第 2 行,因此仅返回第 1 行,因此[[35, 40, 45]]. 请注意,这是一个 1x3 数组。

一般来说,强烈建议使用'slice indexing',因为索引 2 次对于大型数组来说可能会不必要地变慢。

请注意,对于标准 Python 列表,要获得类似的子矩阵,您需要将其编写为:

list_2d = ([[5, 10, 15],
            [20, 25, 30],
            [35, 40, 45]])
[row[1:3] for row in list_2d[1:3]] # result: [[25, 30], [40, 45]]

对于大型列表,这既难读又慢得多。但请注意,标准 Python 可以处理不同类型和长度的子列表,而 numpy 需要相同大小和类型的所有内容。

切片和广播使带有 numpy 的 Python 非常适合数字操作和计算。

于 2020-10-04T16:26:09.213 回答
1

切片有一个顺序:当我做

arr_2d[1:3]

我得到 [[20 25 30],[35 40 45]]

所以我第二次使用它

arr_2d[1:3][1:3]

我得到 [[35 40 45]]

于 2020-10-04T16:17:07.650 回答
1

您必须了解,使用 索引对象时[],您调用的是__getitem__在对象类中定义的方法。现在 numpy 以两种方式定义索引。在您的第一种情况下,您使用与两个参数一起使用并且应该索引矩阵的那个,如

arr_2d[0:2, 0:2]
# returns [[5, 10], [20,25]]

在第二种情况下,您使用定义与普通列表索引几乎相同的那个(接受一个参数的那个)。您将数组切片两次,如下图所示

a1 = arr_2d[1:3] # gets [[20,25,30], [35,40,45]]
a1[1:3] # returns [[35,40,45]]
于 2020-10-04T16:31:32.190 回答