4

我有一个一维数组

i = np.arange(0,7,1)

和一个函数

# Returns a column matrix
def fn(i):
    return np.matrix([[i*2,i*3]]).T


fnv = np.vectorize(fn) 

然后写

fnv(i)

给我一个错误

  File "<stdin>", line 1, in <module>
  File "c:\Python33\lib\site-packages\numpy\lib\function_base.py", 
        line 1872, in __call__
    return self._vectorize_call(func=func, args=vargs)
  File "c:\Python33\lib\site-packages\numpy\lib\function_base.py", 
        line 1942, in _vectorize_call
        copy=False, subok=True, dtype=otypes[0])
  ValueError: setting an array element with a sequence.

我正在寻找的结果是一个具有两行和与输入数组一样多的列的矩阵。numpy 中实现这一目标的最佳符号是什么?

例如会等于

[1,2,3,4,5,6]

并且输出将等于

[[2,4,6,8,10,12],
 [3,6,9,12,15,18]]
4

2 回答 2

6

编辑 你应该尽量避免使用vectorize,因为它给人一种 numpy 效率的错觉,但它里面都是 python 循环。

如果您真的必须处理用户提供的函数,这些函数采用ints 并返回 amatrix的形状(2, 1),那么您可能无能为力。但这似乎是一个非常奇怪的用例。int如果您可以将其替换为接受 an并返回 anint并在需要时使用的函数列表ufuncs,即np.sin代替math.sin,您可以执行以下操作

def vectorize2(funcs) :
    def fnv(arr) :
        return np.vstack([f(arr) for f in funcs])
    return fnv

f2 = vectorize2((lambda x : 2 * x, lambda x : 3 * x))

>>> f2(np.arange(10))
array([[ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18],
       [ 0,  3,  6,  9, 12, 15, 18, 21, 24, 27]])

仅供您参考,我已根据您提出的矢量化进行了计时:

f = vectorize(fn)


>>> timeit.timeit('f(np.arange(10))', 'from __main__ import np, f', number=1000)
0.28073329263679625
>>> timeit.timeit('f2(np.arange(10))', 'from __main__ import np, f2', number=1000)
0.023139129945661807


>>> timeit.timeit('f(np.arange(10000))', 'from __main__ import np, f', number=10)
2.3620706288432984
>>> timeit.timeit('f2(np.arange(10000))', 'from __main__ import np, f2', number=10)
0.002757072593169596

因此,即使对于小型阵列,速度也有一个数量级,对于较大的阵列,速度会增长到 1000 倍,几乎免费提供。

原始答案

vectorize除非没有办法,否则不要使用它,它很慢。请参阅以下示例

>>> a = np.array(range(7))
>>> a
array([0, 1, 2, 3, 4, 5, 6])
>>> np.vstack((a, a+1))
array([[0, 1, 2, 3, 4, 5, 6],
       [1, 2, 3, 4, 5, 6, 7]])
>>> np.vstack((a, a**2))
array([[ 0,  1,  2,  3,  4,  5,  6],
       [ 0,  1,  4,  9, 16, 25, 36]])

无论你的函数是什么,如果它可以用 numpy 的 ufunc 构建,你可以做类似的事情np.vstack((a, f(a)))并得到你想要的

于 2013-01-08T14:40:56.323 回答
0

vectorize 的简单重新实现给了我想要的东西

def vectorize( fn):
    def do_it (array):
        return np.column_stack((fn(p) for p in array))
    return do_it

如果这不是高性能或有更好的方法,请告诉我。

于 2013-01-08T15:08:35.193 回答