0

我尝试用 Theano 编写前向传播代码。我定义了一个类名 hiddenLayer 如下:

从 theano 导入 theano.tensor 作为 T 从 theano 导入共享导入 numpy 作为 np 从 theano 导入函数

class hiddenLayer():
    """ Hidden Layer class
    """
    def __init__(self, n_in, n_out):
        rng = np.random
        self.W = shared(np.asarray(rng.uniform(low=-np.sqrt(6. / (n_in + n_out)),
                                               high=np.sqrt(6. / (n_in + n_out)),
                                               size=(n_in, n_out)),
                                   dtype=T.config.floatX),
                        name='W')
        self.b = shared(np.zeros(n_out, dtype=T.config.floatX), name='b')
        self.x = T.dvector('x')
        self.a = T.tanh(T.dot(self.x, self.W) + self.b)
        self.W_sum = shared(np.zeros([n_in, n_out]), name='W_sum')
        self.gw = 0
        self.gb = 0

我想设置一个 hiddenLayer 对象列表,当前的 hiddenLayer 是下一个 hiddenLayer 的输入。最后我定义了一个名为 forward buy 的函数,它会引发错误,代码如下:

def init_network(n_in, n_out, sl, x, y):
    l = []
    for i in range(sl):
        l.append(hiddenLayer(n_in, n_out))
    for i in range(sl):
        if i == 0:
            l[i].x = x
        elif i < sl-1:
            l[i].x = l[i-1].a
        else:
            l[i].x = l[i-1].a
            y = l[i].a
    return x, y, l

x = T.dvector('x')
y = T.dvector('y')
x, y, l = init_network(3, 3, 3, x, y)
forward = function(inputs=[x], outputs=y)

错误信息是:

theano.compile.function_module.UnusedInputError: theano.function was asked to create a function computing outputs given certain inputs, but the provided input variable at index 0 is not part of the computational graph needed to compute the outputs: x.
To make this error into a warning, you can pass the parameter on_unused_input='warn' to theano.function. To disable it completely, use on_unused_input='ignore'.

你能告诉我为什么有什么问题以及如何解决它吗?谢谢

4

1 回答 1

1

问题是您在第二个循环中覆盖了 lx 。你不能那样做。在init中使用 self.x 后,基于它的结果将基于 self.x 的当前实例。因此,当您覆盖它时,它不会在新 x 上重新创建其他内容。

您应该将 x 作为输入传递给init。如果没有,创建一个。这是第一层。对于另一个,它应该是前一层输出。

def __init__(self, n_in, n_out, x=None):
   if x is not None:
      self.x = x
   else:
      x = T.dvector('x')
于 2014-05-14T17:29:04.027 回答