7 年多来一直存在一些相关问题,但我再次提出这个问题,因为我看不到提供了“numpy”方式的迭代方法。
任务如下:如果我有一个 numpy 数组 'arr' 并有一个自定义函数'fn',我怎么能在 'arr' 上迭代地应用 'fn'?'fn' 不能由 ufunc 工具构造。
下面是我想出的玩具代码:
import numpy as np
r_list = np.arange(1,6,dtype=np.float32)
# r_list = [1. 2. 3. 4. 5.]
r_list_extended = np.append([0.],r_list)
R_list_extended = np.zeros_like(r_list_extended)
print(r_list)
gamma = 0.99
pv_mc = lambda a, x: x+ a*gamma
# no cumsum, accumulate available
for i in range(len(r_list_extended)):
if i ==0: continue
else: R_list_extended[i] = pv_mc(R_list_extended[i-1],r_list_extended[i])
R_list = R_list_extended[1:]
print(R_list)
# R_list == [ 1. 2.99 5.9601 9.900499 14.80149401]
r_list 是每次的 r 数组。R_list 是折扣 r 的累积和。假设 r_list 和 R_list 预先恢复。上面的循环执行 R[t] : r[t] + gamma * R[t-1]
我不认为这是利用 numpy 的最佳方式......如果可以利用 tensorflow,那么 tf.scan() 的工作如下:
import numpy as np
import tensorflow as tf
r_list = np.arange(1,6,dtype=np.float32)
# r_list = [1. 2. 3. 4. 5.]
gamma = 0.99
pv_mc = lambda a, x: x+ a*gamma
R_list_graph = tf.scan(pv_mc, r_list, initializer=np.array(0,dtype=np.float32))
with tf.Session() as sess:
R_list = sess.run(R_list_graph, feed_dict={})
print(R_list)
# R_list = [ 1. 2.99 5.9601 9.900499 14.801495]
在此先感谢您的帮助!