我有 lambda 函数的速度问题。这是代码:
Lit Simplifier::lit_diff_watches(const OccurClause& a, const OccurClause& b)
{
set_seen_for_lits(b, 1);
size_t num = 0;
Lit toret = lit_Undef;
const auto check_seen = [&] (const Lit lit) {
if (seen[lit.toInt()] == 0) {
toret = lit;
num++;
}
};
for_each_lit(a, check_seen);
/*switch(a.ws.getType()) {
case CMSat::watch_binary_t:
check_seen(a.lit);
check_seen(a.ws.lit2());
break;
case CMSat::watch_tertiary_t:
check_seen(a.lit);
check_seen(a.ws.lit2());
check_seen(a.ws.lit3());
break;
case CMSat::watch_clause_t: {
const Clause& clause = *solver->clAllocator->getPointer(a.ws.getOffset());
for(const Lit lit: clause) {
check_seen(lit);
}
break;
}
}*/
set_seen_for_lits(b, 0);
if (num == 1)
return toret;
else
return lit_Undef;
}
该for_each_lit
函数的签名是:
void for_each_lit(
const OccurClause& cl
, std::function<void (const Lit lit)> func
);
该函数lit_diff_watches
运行数百万次,以 3.3s 为例。但是,当我取消注释开关并注释掉for_each_line
(这是开关的复制粘贴)时,我得到 1.7 秒的相同运行时间。请注意,99% 的时间watch_binary_t
或发生,即每个函数调用watch_tertiary_t
只应执行很少的指令。lit_diff_watches
你能告诉我我做错了什么吗?GCC 4.7 和当前的 llvm-svn(2013 年 11 月 25 日)的行为相同,时间差异很小。我猜函数调用不是内联的,但我不是专家。我想修复这个问题,因为这switch(..){..}
在代码中的很多地方,并且使用 lambdas &for_each_lit
会显着清理代码。但是,我不能为此失去这么多的速度。10-20% 就可以了,但几乎 2 倍的减速就太多了。