1

我在 C++ 中实现了一个简单的折叠函数,它接受一个 lambda,并且可以在编译时同时折叠多个向量。我想知道它是否可以以某种方式简化(我提供了递归版本和迭代递归版本 - 我不确定哪个应该有更好的性能):https ://godbolt.org/z/39pW81

也欢迎性能优化 - 在这方面,这两种方法中的任何一种更快吗?

template<int I, typename type_identity, typename type_head, int N, typename ...type_tail, int ...N_tail,  typename Function>
auto foldHelperR(Function&& func, const type_identity& id, const tvecn<type_head, N>& head, const tvecn<type_tail, N_tail>&... tail)
{
    if constexpr (I>0)
    {
        return func(foldHelperR<I-1>(std::forward<Function>(func), id, head, tail...), head[I], tail[I]...);
    }
    else
    {
        return func(id, head[0], tail[0]...);
    }
}

template<int I, typename type_identity, typename type_head, int N, typename ...type_tail, int ...N_tail,  typename Function>
auto foldHelperI(Function&& func, const type_identity id, const tvecn<type_head, N>& head, const tvecn<type_tail, N_tail>&... tail)
{
    if constexpr (I<N-1)
    {
        return foldHelperI<I+1>(std::forward<Function>(func), func(id, head[I], tail[I]...), head, tail...);
    }
    else
    {
        return func(id, head[N-1], tail[N-1]...);
    }
}

template<typename type_identity, typename type_head, int N_head, typename ...type_tail, int ...N_tail, typename Function = void (const type_identity&, const type_head&, const type_tail&...)>
constexpr auto fold(Function&& func, const type_identity& id, const tvecn<type_head, N_head>& head, const tvecn<type_tail, N_tail>&... tail)
{
    static_assert(std::is_invocable_v<Function, const type_identity&, const type_head&, const type_tail &...>,
     "The function cannot be invoked with these zip arguments (possibly wrong argument count).");
    static_assert(all_equal_v<N_head, N_tail...>, "Vector sizes must match.");

    //return foldHelperR<N_head-1>(std::forward<Function>(func), id, head, tail...);
    return foldHelperI<0>(std::forward<Function>(func), id, head, tail...);
}

int main()
{
    tvecn<int,3> a(1,2,3);
    return fold([](auto x, auto y, auto z) {return x+y+z;}, 0, a, a);
}
4

2 回答 2

3

并且可以在编译时同时折叠多个向量

不完全是:如果你想操作编译时

(1) 你必须定义构造函数constexprtvecn

(2) 你必须定义constexprfoldhelper 函数和

(3) 你必须申报constexpr a

 // VVVVVVVVV
    constexpr tvecn<int,3> a(1,2,3);

(4) 你必须将 fold 的结果放在一个constexpr变量中(或者,更一般地说,放在编译时需要值的地方,作为 C 样式数组的 size 字段,或者模板值参数,或者一个static_assert()测试)

constexpr auto f = fold([](auto x, auto y, auto z) {return x+y+z;},
                        0, a, a);

我想知道它是否可以以某种方式简化

当然。

首先:如果可以,请避免重新发明轮毂:您tvecnstd::array.

建议:使用std::array(如果可以的话)

第二:您标记了 C++17,因此您可以使用折叠

也用于all_equal

template <auto V0, auto ... Vs>
struct all_equal : public std::bool_constant<((V0 == Vs) && ...)>
 { };

template<auto ...N_pack>
constexpr bool all_equal_v = all_equal<N_pack...>::value;

更一般地说:当您必须定义必须提供数字的自定义类型特征时,继承(如果可能)从std::integral_constant(或std::bool_constant,或std::true_type,或std::false_type:所有std::integral_constant特化)。因此,您会自动继承所有std::integral_constant设施。

第三:几乎所有 C++ 标准都使用std::size_t, notint来表示大小。

建议:当你必须与大小有关时,使用std::size_t,而不是int。这样可以避免很多烦人的麻烦。

第四: from main()you 应该只返回EXIT_SUCCESS(通常为零)或EXIT_FAILURE(通常为 1)

建议:避免事情作为

return fold([](auto x, auto y, auto z) {return x+y+z;}, 0, a, a);

第五:永远不要低估逗号运算符的威力。

建议:完全避免递归,对辅助函数也使用模板折叠;举例

template <std::size_t ... Is, typename F, typename T, typename ... As>
constexpr auto foldHelperF (std::index_sequence<Is...>,
                            F const & f, T id, As const & ... arrs)
 { return ( ..., (id = [&](auto i){ return f(id, arrs[i]...); }(Is))); }

您可以按以下方式调用fold()

return foldHelperF(std::make_index_sequence<N_head>{}, 
                   std::forward<Function>(func),
                   id, head, tail...);

以下是完整的编译和简化示例

#include <array>
#include <utility>
#include <iostream>
#include <type_traits>

template <auto V0, auto ... Vs>
struct all_equal : public std::bool_constant<((V0 == Vs) && ...)>
 { };

template<auto ...N_pack>
constexpr bool all_equal_v = all_equal<N_pack...>::value;


template <std::size_t ... Is, typename F, typename T, typename ... As>
constexpr auto foldHelperF (std::index_sequence<Is...>,
                            F const & f, T id, As const & ... arrs)
 { return ( ..., (id = [&](auto i){ return f(id, arrs[i]...); }(Is))); }


template <typename type_identity, typename type_head, std::size_t N_head,
          typename ...type_tail, std::size_t ...N_tail,
          typename Function = void (type_identity const &,
                                    type_head const &,
                                    type_tail const & ...)>
constexpr auto fold (Function && func, type_identity const & id,
                     std::array<type_head, N_head> const & head,
                     std::array<type_tail, N_tail> const & ... tail)
 {
   static_assert( std::is_invocable_v<Function, const type_identity&,
                  const type_head&, const type_tail &...>,
                  "The function cannot be invoked with these zip arguments"
                  " (possibly wrong argument count).");

   static_assert( all_equal_v<N_head, N_tail...>,
                 "Vector sizes must match.");

   return foldHelperF(std::make_index_sequence<N_head>{}, 
                      std::forward<Function>(func),
                      id, head, tail...);
}

int main()
 {
   constexpr std::array<int, 3u> b{2, 5, 7};

   constexpr auto f = fold([](auto x, auto y, auto z) {return x+y+z;},
                           0, b, b);

   std::cout << f << std::endl;
 }
于 2019-10-21T10:57:57.127 回答
2

使用 Fold 表达式,它可能是:

template <typename F, typename Init, std::size_t... Is, typename... Arrays>
constexpr auto fold_impl(F&& f, Init init, std::index_sequence<Is...>, Arrays&&... arrays)
{
    auto l = [&](Init init, std::size_t i){ return f(init, arrays[i]...); };
    return ((init = l(init, Is)), ...);
}


template <typename F, typename Init, typename Array, typename ... Arrays>
constexpr auto fold(F&& f, Init init, Array&& array, Arrays&&... arrays)
{
    static_assert(((arrays.size() == array.size()) && ...));
    return fold_impl(f, init, std::make_index_sequence<array.size()>{}, array, arrays...);
}

演示

于 2019-10-21T10:49:16.927 回答