4

我想在变量中的权重中强制对称。我真的想要一个近似的圆形对称。但是,我可以想象行或列强制对称。

目标是通过减少自由变量的数量来减少训练时间。我知道我的问题需要一个对称数组,但我可能想同时包含对称变量和“自由”变量。我现在正在使用 conv2d,所以我相信我需要继续使用它。

4

2 回答 2

5

这是一个函数,它创建一个关于其中心行上的反射对称的内核:

def SymmetricKernels(height,width,in_channels,out_channels,name=None):
    half_kernels = tf.Variable(initial_value=tf.random_normal([(height+1)//2,width,in_channels,out_channels]))
    half_kernels_reversed = tf.reverse(half_kernels[:(height//2),:,:,:],[0])
    kernels = tf.concat([half_kernels,half_kernels_reversed],axis=0,name=name)
    return kernels

使用示例:

w = SymmetricKernels(5,5,1,1)
sess = tf.InteractiveSession()
sess.run(tf.global_variables_initializer())
w_ = sess.run(w)
w_[:,:,0,0]
# output:
# [[-1.299 -1.835 -1.188  0.093 -1.736]
#  [-1.426 -2.087  0.434  0.223 -0.65 ]
#  [-0.217 -0.802 -0.892 -0.229  1.383]
#  [-1.426 -2.087  0.434  0.223 -0.65 ]
#  [-1.299 -1.835 -1.188  0.093 -1.736]]

这个想法是使用tf.Variable()仅创建内核 ( ) 的上半部分变量half_kernels,然后将对称内核形成为上半部分及其反射版本的串联。

这个想法可以扩展到创建具有左右对称和上下对称的内核。

于 2018-03-24T20:56:50.587 回答
3

您可以尝试的另一件事是通过两次卷积来束缚网络,重用内核但将其翻转以进行第二次卷积(未经测试的代码):

def symmetric_convolution(input_tensor, n_filters, size, name, dilations=[1,1,1,1]):
    with tf.variable_scope("", reuse=tf.AUTO_REUSE):
        kernel = tf.get_variable(shape=[*size, input_tensor.shape[-1], n_filters], name='conv_kernel_' + name, ...)
        lr_flipped_kernel = tf.reverse(kernel, axis=[1], name='conv_kernel_flipped_lr_' + name)

    conv_l = tf.nn.conv2d(input=input_tensor, filter=kernel, strides=[1, 1, 1, 1], padding='SAME', dilations=dilations)
    conv_r = tf.nn.conv2d(input=input_tensor, filter=lr_flipped_kernel, strides=[1, 1, 1, 1], padding='SAME', dilations=dilations)

    return tf.reduce_max(tf.concat([conv_l, conv_r], axis=-1), keepdims=True, axis=[-1])

您可以根据需要添加偏差、激活等。我过去使用过类似的东西——reduce_max可以让你的内核采取任何形状,并有效地为你提供两个卷积;如果您reduce_sum改用,任何不对称都会很快平均化,并且您的内核将是对称的。最有效的方法取决于您的用例。

于 2019-02-25T15:06:06.300 回答