opengl - OpenGL 3.3 两个 GPU 上的两个不同结果 nVidia Optimus 与阴影映射

Question

因此，我正在使用 C++ 开发一个项目（在未来学习和创建游戏），而对于渲染，我选择了 OpenGL 3.3。我一直在研究我的处理器中内置的 Intel HD 4000，因为它会打开默认的新应用程序，一切都很顺利。但后来我尝试在我的第二个 GPU - nVidia GTX660m 上打开它，它要快得多，而且我预计它会有更多的 FPS。但是不，不仅我有几十个错误（例如 - 如果我在片段着色器中将 vec3 作为颜色输出，英特尔就可以了，但如果我没有输出 vec4，nVidia 就会完全疯狂的风格......）。当然编译时没有任何错误，所以它很难修复......

但是现在，当我解决了大部分问题时，我正在努力解决一个我无法按照我的意愿解决的问题（可能有一些肮脏的方法，但是......这不是重点）。

简而言之：我在两个 GPU 上生成有效深度图，但在 nVidia GPU 上它不是灰度的，bur red-to-black scale这非常奇怪，因为同一台机器上的相同代码（几乎）应该运行相同（也相同的 API！）。由于这个事实，我的片段着色器可能没有赶上它，并且在 nVidia 上没有检测到被照亮的区域并且它完全黑暗（至少在聚光灯下，定向光不起作用）。

图片：使用 Intel HD4000 时的图像（来自我的 i5 ivy-bridge cpu）从 RMB 菜单运行应用程序时使用 nVidia GTX660m 时的图像。没有柔和的阴影

重要 - 请注意 GTX660m 上的深度图是 redToBlack 比例，而不是像 Intel GPU 上的灰度。顶部的一个来自定向光，底部的一个当然来自点光源。

我的 FragmentShader：#version 330 核心

in vec2 UV;                         //Coords for standard texture (model)
in vec4 ShadowCoord;                //Coords for directional light (pos)
in vec4 POVShadowCoord;             //Coords for spot light (flashlight) (pos)

out vec4 color;                     //Output color

uniform sampler2D myTextureSampler; //Standard texture with data for models
uniform sampler2D shadowMap;        //Shadowmap for directional light
uniform sampler2D POVshadowMap;     //Shadowmap for spot light (flashlight)

void main(){
    vec3 tex_data = texture2D( myTextureSampler, UV ).rgb;

    float bias = 0.005;
    float visibility = 0.7;
    float decrease = 0.002;

    int early_bailing = 0;
    if ( texture2D( shadowMap, ShadowCoord.xy + vec2(0,0)/1850.0 ).z  <  ShadowCoord.z-bias ) {
        visibility -= decrease; early_bailing++;
    }
    if ( texture2D( shadowMap, ShadowCoord.xy + vec2(-2,-2)/1850.0 ).z  <  ShadowCoord.z-bias ) {
        visibility -= decrease; early_bailing++;
    }
    if ( texture2D( shadowMap, ShadowCoord.xy + vec2(-2, 2)/1850.0 ).z  <  ShadowCoord.z-bias ) {
        visibility -= decrease; early_bailing++;
    }
    if ( texture2D( shadowMap, ShadowCoord.xy + vec2( 2,-2)/1850.0 ).z  <  ShadowCoord.z-bias ) {
        visibility -= decrease; early_bailing++;
    }
    if ( texture2D( shadowMap, ShadowCoord.xy + vec2( 2, 2)/1850.0 ).z  <  ShadowCoord.z-bias ) {
        visibility -= decrease; early_bailing++;
    }
    if(early_bailing < 5) {
        if(early_bailing > 0) {
            for (int i=-2; i < 2; i++) {
                for(int j = -2; j < 2; j++) {
                    if(i ==  0 && j ==  0) continue;
                    if(i == -2 && j == -2) continue;
                    if ( texture2D( shadowMap, ShadowCoord.xy + vec2(i,j)/850.0 ).z  <  ShadowCoord.z-bias )
                        visibility -= decrease;
                }
            }
        }
    } else {
        visibility -= 14 * decrease;
    }

    float x = POVShadowCoord.x/POVShadowCoord.w;
    float y = POVShadowCoord.y/POVShadowCoord.w;
    bias = 0.0004;
    if(x < 0 || x > 1 || y < 0 || y > 1) {
        visibility -= 0.6;
    } else {
        float min_visibility = visibility - 0.6;
        if ( textureProj( POVshadowMap, POVShadowCoord.xyw).z < (POVShadowCoord.z - bias)/POVShadowCoord.w) {
            visibility = min_visibility;
        } else {
            //Flashlight effect
            float dx = 0.5 - x;
            float dy = 0.5 - y;
            visibility -= sqrt(dx*dx + dy*dy);
            if(visibility < min_visibility)
                visibility = min_visibility;
        }
    }

    color = vec4(visibility * tex_data, 1);
}

第一部分用于定向光 - 我在 5 个点中预采样深度图，如果所有点都相同，我不会进行更多采样（早期保释 - 很多性能优化！），或者如果有些不同，我会全部采样并计算当前片段上的阴影强度.

第二部分是简单地从点光深度图采样，然后我检查到光线中心的距离以模拟手电筒效果（中心更强）。

我认为不需要更多，但如果需要，请写，我会发布所需的代码。

还 - 阴影贴图只有 16 位精度（GL_DEPTH_COMPONENT16）英特尔 HD4000 比我的 GTX660m 更快（它更强大） - 这很奇怪。虽然我认为这是因为我不画任何高多边形，只是很多非常低的多边形。我对么？

score 1 · Accepted Answer

我在别处得到了答案。供将来参考 - 采样深度图使用红色通道（或 .x 值），如 sample.r (/sample.x)，而不是像我一样的 .b (/.z)。

opengl - OpenGL 3.3 两个 GPU 上的两个不同结果 nVidia Optimus 与阴影映射

1 回答 1

Related

Reference