对称矩阵的高效类型
您只需将值分配给矩阵的下/上三角部分并使用本征三角和自伴随视图。但是,我已经在小型固定大小的矩阵上进行了测试。我注意到在性能方面,使用视图并不总是最好的选择。考虑以下代码:
Eigen::Matrix2d m;
m(0,0) = 2.0;
m(1,0) = 1.0;
// m(0,1) = 1.0;
m(1,1) = 2.0;
Eigen::Vector2d v;
v << 1.0,1.0;
auto result = m.selfadjointView<Eigen::Lower>()*v;
与下面介绍的替代解决方案相比,最后一行中的产品非常慢(double 2x2
在我的例子中,矩阵慢了大约 20%)。(使用完整矩阵的乘积,通过取消注释m(0,1) = 1.0;
和使用auto result = m*v
,对于double 2x2
矩阵来说甚至更快)。
一些替代品。
1)将对称矩阵存储在向量中
您可以将矩阵存储在大小为 45 的向量中。以向量格式对 2 个矩阵求和很简单(只需对向量求和)。但是您必须为产品编写自己的实现。
这是这样一个matrix * vector
产品(密集,固定大小)的实现,其中矩阵的下部按列存储在向量中:
template <typename T, size_t S>
Eigen::Matrix<T,S,1> matrixVectorTimesVector(const Eigen::Matrix<T,S*(S+1)/2,1>& m, const Eigen::Matrix<T,S,1>& v)
{
Eigen::Matrix<T,S,1> ret(Eigen::Matrix<T,S,1>::Zero());
int counter(0);
for (int i=0; i<S; ++i)
{
ret[i] += m(counter++)*v(i);
for (int j=i+1; j<S; ++j)
{
ret[i] += m(counter)*v(j);
ret[j] += m(counter++)*v(i);
}
}
return ret;
}
2)只存储三角形部分并实现自己的操作
您当然也可以实现自己的 product matrix * vector
,其中矩阵仅存储 45 个元素(假设我们存储下三角形部分)。这可能是最优雅的解决方案,因为它保持矩阵的格式(而不是使用表示矩阵的向量)。然后,您还可以使用本征函数,如下例所示:
template <typename T, size_t S>
Eigen::Matrix<T,S,S> symmMatrixPlusSymmMatrix( Eigen::Matrix<T,S,S>& m1, const Eigen::Matrix<T,S,S>& m2)
{
Eigen::Matrix<T,S,S> ret;
ret.template triangularView<Eigen::Lower>() = m1 + m2; // no performance gap here!
return ret;
}
在上面的函数中(2 个对称矩阵的和),只访问了 m1 和 m2 的下三角部分。请注意,triangularView
在这种情况下不会出现性能差距(我根据我的基准确认了这一点)。
matrix * vector
产品见下例(性能与方案一中的产品相同)。该算法只访问矩阵的下三角部分。
template <typename T, size_t S>
Eigen::Matrix<T,S,1> symmMatrixTimesVector(const Eigen::Matrix<T,S,S>& m, const Eigen::Matrix<T,S,1>& v)
{
Eigen::Matrix<T,S,1> ret(Eigen::Matrix<T,S,1>::Zero());
int counter(0);
for (int c=0; c<S; ++c)
{
ret(c) += m(c,c)*v(c);
for (int r=c+1; r<S; ++r)
{
ret(c) += m(r,c)*v(r);
ret(r) += m(r,c)*v(c);
}
}
return ret;
}
Matrix2d*Vector2d
在我的例子中,与使用完整矩阵(2x2 = 4 个元素)的产品相比,产品的性能增益为10%。