0

我正在构建一个卷积神经网络,并使用均方误差作为成本函数。当网络输出超过一时,我将成本函数更改为没有错误,因此当它更大时我将输出阈值设置为一。使用此代码

 def MSE2(self, y):

        loc = np.where(y == 1)[0]
        for i in range(len(loc)):
            if self.input2[loc[i]] > 1:
                self.input2[loc[i]] = 1

        return T.mean((y - self.input2) ** 2)

我想知道theano梯度函数在计算梯度时是否会考虑到这一点,或者我应该改变其他东西。

除此之外,有没有其他方法可以优化此代码以更快地运行或在 GPU 上运行。

4

2 回答 2

0

您可以使用T.剪辑(self.input2, minimum_value, 1),它将剪辑多个值并将它们设置为 1。不需要循环。

于 2017-04-27T23:44:45.477 回答
0

所以我发现解决这个问题的最好方法是

def MSE2(self, y):
    loc = T.eq(y,1).nonezeros()[0]
    S = T.clip(self.input2[loc],0,1)
    self.input2 = T.set_subtensor(self.input2[loc], S)
    return T.mean((y - self.input2) ** 2)

我已经测试了结果和渐变。

于 2017-04-28T07:46:07.013 回答