2

我正在尝试使 ArrayFire 中的数组饱和。我希望所有大于 0.75 的值都饱和到 1.0,所有小于 0.25 的值都饱和到 0.0。我正在使用以下表达式。

a(a > 0.75) = 1.0;
a(a < 0.25) = 0.0;

这是一个 af::array 类型。它工作了一段时间,但是一旦我得到一个没有大于 0.75 的值的数组,我就会得到以下异常。

terminate called after throwing an instance of 'af::exception'
  what():  ArrayFire Exception (Invalid input size:203):
In function verifyDims
In file src/api/c/data.cpp:36
Invalid dimension for argument 1
Expected: ndims >= 1

In function af::array af::constant(T, const af::dim4&, af::dtype) [with T = double; af::dtype = af_dtype]
In file src/api/cpp/data.cpp:28

如果我打电话af::print("", a > 0.75);,我会在它崩溃之前得到以下输出。

[10 1 1 1]
         0 
         0 
         0 
         0 
         0 
         0 
         0 
         0 
         0 
         0 

是否以某种方式看到这个数组全为零(应该是因为 non 大于 0.75)然后说维度为零?是我做错了什么还是他们代码中的错误?

下面的代码似乎可以解决它,但我觉得这个解决方案效率低下。

af::array bellow = a[levels - 1] < 0.25f;
af::array above = a[levels - 1] > 0.75f;

if(af::anyTrue<bool>(above))
    a[levels - 1](above) = 0.75f;

if(af::anyTrue<bool>(bellow))
    a[levels - 1](bellow) = 0.25f;

对于那些想要查看整个函数的人,我正在神经网络中进行梯度处理。a 实际上是 af::array 类型的数组。为了简化问题,我忽略了这一点。

void train(const float* in, const float* expected_out, float learning_rate)
{
    std::unique_ptr<af::array[]> a(new af::array[levels]),
            z(new af::array[levels]), d(new af::array[levels]);

    af::array in_array(inputs, in);
    af::array y(dims[levels - 1], expected_out);

    z[0] = af::matmul(weights[0], in_array) + biases[0];
    a[0] = sigma(z[0]);


    for(size_t i = 1; i < levels; i++)
    {
        z[i] = af::matmul(weights[i], a[i - 1]) + biases[i];
        a[i] = sigma(z[i]);
    }


    a[levels - 1](a[levels - 1] < 0.25f) = 0.0f;
    a[levels - 1](a[levels - 1] > 0.75f) = 1.0f;

    d[levels - 1] = (y - a[levels - 1]) * sigma_prime(z[levels - 1]);
    for(size_t i = levels - 1; i-- > 0;)
        d[i] = af::matmul(weights[i + 1].T(), d[i + 1]) * sigma_prime(z[i]);

    for(size_t i = 0; i < levels; i++)
    {
        biases[i] += learning_rate * d[i];
        weights[i] += learning_rate * af::matmul(d[i], (i ? a[i - 1] : in_array).T());
    }
}
4

1 回答 1

4

您看到的错误是由于这个关于零长度数组的开放错误编辑:从 v3.4.0 开始修复)。这是一个普遍存在的问题,我们正在尝试正确修复一段时间。

这是您的案例的解决方法。你甚至不需要索引来实现你想要做的事情。

a[levels - 1] = af::min(0.75, af::max(0.25, a[levels - 1]));

编辑:从 3.4 开始,您可以执行以下操作以在 arrayfire 中实现相同的功能:

a[levels - 1] = af::clamp(a[levels - 1], 0.25, 0.75);

这种方法比为您的案例建立索引要快得多。


也就是说,在某些情况下您不能使用af::minaf::max替换索引。在这些情况下,您可以执行以下操作作为解决方法:

af::array cond = arr < some_val;
arr = arr * (1 - cond) + cond * other_val;

这也应该比索引更快。NAN但是,如果数组中有数组并且您尝试替换它们,则该算法将不起作用。在这种情况下,您可以回退到以下功能之一。

使用 select (使用额外的内存):

arr = af::select(af::isNaN(arr), arr, other_val));

使用替换(原地替换,不使用额外内存):

af::replace(arr, af::isNaN(arr) other_val));

然而,一些基准测试向我们展示了这一点,select并且replace在某些情况下可能比索引慢(我们正在尝试修复)。select因此,如果/replace算法速度慢,您可以尝试使用以下变通方法进行索引。

af::array idx = af::where(af::isNaN(arr));
if (idx.elements()) arr(idx) = replace_val;

请注意,在内部af::array调用布尔值的索引。af::where所以这与以下一样有效

arr(arr < some_val) = other_val;

具有零大小数组不会失败的额外好处。

编辑:为后代添加了额外的解决方法。

于 2016-03-28T22:13:27.867 回答