c++ - 在没有分支的情况下比较字符是否相等

Question

static
lvh_distance levenshtein_distance( const std::string & s1, const std::string & s2 )
{
    const size_t len1 = s1.size(), len2 = s2.size();
    std::vector<unsigned int> col( len2+1 ), prevCol( len2+1 );

    const size_t prevColSize = prevCol.size();
    for( unsigned int i = 0; i < prevColSize; i++ )
        prevCol[i] = i;

    for( unsigned int i = 0, j; i < len1; ++i )
    {
        col[0] = i+1;
        const char s1i = s1[i];
        for( j = 0; j < len2; ++j )
        {
            const auto minPrev = 1 + std::min( col[j], prevCol[1 + j] );
            col[j+1] = std::min( minPrev, prevCol[j] + (  s1i == s2[j] ? 0 : 1   ) );

        }
        col.swap( prevCol );
    }
    return prevCol[len2];
}

一位用户评论说我可以替换s1i == s2[j] ? 0 : 1为((s1i - s2[j]) & 0x80) >> 7以防止条件跳转。这个把戏是错误的，用户删除了他的评论，但我想知道是否真的有办法做到这一点。

score 3 · Accepted Answer

假设代码

s1i == s2[j] ? 0 : 1

确实为您提供了您真正想避免的分支操作，您可以简单地尝试以下操作：

!(s1i == s2[j])

这应该会产生相同的效果，并且可以帮助编译器删除分支。或者，您可以颠倒逻辑并编写

s1i != s2[j]

与这种类型的优化一样，永远无法保证这实际上会达到您希望的结果。优化器做了很多聪明的事情，试图预测他们对你的技巧的反应通常很困难。因此，即使在最好的情况下，您所能做的就是尝试不同的解决方案并比较生成的二进制代码。

score 2 · Accepted Answer

为什么不使用以下内容： !(s1i == s2[j])或者(s1i != s2[j])因为 bool 到 int 的转换是隐式的

score 1 · Accepted Answer

不是一个实际的答案，而是解决一个难题。
创建一个数组one_or_zero[UCHAR_MAX+1]，用 1 填充它，one_or_zero[0] = 0;
现在你可以做这样的事情，prevCol[j] + one_or_zero[s1i^s2[j]])
这将导致 0s1i==s2[j]和 1 被添加到prevCol[j]

c++ - 在没有分支的情况下比较字符是否相等

3 回答 3

Related

Reference