5

我有一个奇怪的问题。我有以下代码:

template<clss index, class policy>
inline int CBase<index,policy>::func(const A& test_in, int* srcPtr ,int* dstPtr)
{
    int width = test_in.width();
    int height = test_in.height();

    double d = 0.0; //here is the problem
    for(int y = 0; y < height; y++)
    {

        //Pointer initializations

        //multiplication involving y
        //ex: int z = someBigNumber*y + someOtherBigNumber;
        for(int x = 0; x < width; x++)
        {
            //multiplication involving x
        //ex: int z = someBigNumber*x + someOtherBigNumber;
            if(soemCondition)
            {
                // floating point calculations
            }
            *dstPtr++ = array[*srcPtr++];
        }
    }
}

内部循环执行了近 200,000 次,整个函数需要 100 毫秒才能完成。(使用 AQTimer 分析)

double d = 0.0;我在外循环外发现了一个未使用的变量 并将其删除。在此更改之后,突然该方法需要 500 毫秒来执行相同数量的执行。(慢 5 倍)。

这种行为在具有不同处理器类型的不同机器中是可重现的。(Core2,双核处理器)。

我正在使用具有优化级别的 VC6 编译器O2。以下是使用的其他编译器选项:

 -MD -O2 -Z7 -GR -GX -G5 -X -GF -EHa

我怀疑编译器优化并删除了编译器优化/O2。在该功能变得正常之后,它需要 100 毫秒作为旧代码。

任何人都可以对这种奇怪的行为有所了解吗?

为什么当我删除未使用的变量时编译器优化会降低性能?

注意:汇编代码(更改之前和之后)看起来相同。

4

3 回答 3

5

如果汇编代码在更改前后看起来相同,则错误以某种方式与您对函数计时的方式有关。

于 2010-04-29T06:45:01.147 回答
4

VC6 是马车。众所周知,在某些情况下会生成不正确的代码,而且它的优化器也不是那么先进。该编译器已有十多年的历史,甚至多年没有得到支持。

所以真的,答案是“你正在使用一个有问题的编译器。期待有错误的行为,尤其是在启用优化时。”

我不认为升级到现代编译器(或简单地测试代码)是一种选择?

显然,生成的程序集不能相同,否则不会有性能差异。

唯一的问题是区别在哪里。对于一个有缺陷的编译器,很可能是代码中一些完全不相关的部分突然以不同的方式编译并中断。但很可能,为该函数生成的汇编代码并不相同,而且差异是如此微妙,以至于您没有注意到它们。

于 2010-04-29T17:18:18.363 回答
1

width将and声明height为 const {unsigned} 整数。{应该使用无符号,因为高度和宽度永远不会是负数}

const int width = test_in.width();
const int height = test_in.height();

这有助于编译器进行优化。使用 as 的值const,它可以将它们放在代码或寄存器中,知道它们不会改变。此外,它使编译器不必猜测变量是否在变化。

我建议打印出未使用double和未使用版本的汇编代码。这将使您深入了解编译器的思考过程。

于 2010-04-29T16:56:34.710 回答