5

假设我们要计算矩阵和列向量的点积:

矩阵点向量

所以在 Numpy/Python 中,我们开始:

a=numpy.asarray([[1,2,3], [4,5,6], [7,8,9]])
b=numpy.asarray([[2],[1],[3]])
a.dot(b)

结果是:

数组([[13],[31],[49]])

到目前为止,一切都很好,但是为什么这也有效?

b=numpy.asarray([2,1,3])
a.dot(b)

结果是:

数组([13, 31, 49])

我希望 [2,1,3] 是一个行向量(需要转置来应用点积),但 Numpy 似乎默认将数组视为列向量(在矩阵乘法的情况下)?

这是如何运作的?

编辑:

为什么是:

b=numpy.asarray([2,1,3])
b.transpose()==b

所以矩阵点向量数组确实有效(因此它将其视为列向量),但是其他操作(转置)不起作用。这不是真正一致的设计,不是吗?

4

1 回答 1

5

我们先来了解一下dotnumpy中是如何定义操作的。

(为简单起见,将广播规则排除在讨论之外)dot(A,B)如果 A 的最后一个维度(即A.shape[-1])与 B 的倒数第二个维度(即 B.shape[-2])相同,则可以执行 B. ndim>=2,如果 B.ndim==1 则简单地为 B 的维数。

换句话说,如果A.shape=(N1,...,Nk,X)B.shape=(M1,...,M(j-1),X,Mj)(注意共同点X)。结果数组将具有形状(N1,...,Nk,M1,...,Mj)(注意X已删除)。

或者,如果A.shape=(N1,...,Nk,X)B.shape=(X,)。结果数组将具有形状(N1,...,Nk)(注意X已删除)。

您的示例之所以有效,是因为它们满足规则(第一个示例满足第一个,第二个满足第二个):

a=numpy.asarray([[1,2,3], [4,5,6], [7,8,9]])
b=numpy.asarray([[2],[1],[3]])
a.shape, b.shape, '->', a.dot(b).shape  # X=3
=> ((3, 3), (3, 1), '->', (3, 1))

b=numpy.asarray([2,1,3])
a.shape, b.shape, '->', a.dot(b).shape  # X=3
=> ((3, 3), (3,), '->', (3,))

我的建议是,在使用 numpy 时,不要考虑“行/列向量”,如果可能的话,根本不要考虑“向量”,而是考虑“形状为 S 的数组” . 这意味着行向量和列向量都只是“1dim 数组”。就 numpy 而言,它们是一回事。

这也应该清楚为什么在您的情况下b.transponse() is the same as bb作为一个 1dim 数组,当transposed时,仍然是一个 1dim 数组。转置不影响 1dim 数组。

于 2016-01-05T08:59:33.197 回答