因此,我正在使用 C++ 开发一个项目(在未来学习和创建游戏),而对于渲染,我选择了 OpenGL 3.3。我一直在研究我的处理器中内置的 Intel HD 4000,因为它会打开默认的新应用程序,一切都很顺利。但后来我尝试在我的第二个 GPU - nVidia GTX660m 上打开它,它要快得多,而且我预计它会有更多的 FPS。但是不,不仅我有几十个错误(例如 - 如果我在片段着色器中将 vec3 作为颜色输出,英特尔就可以了,但如果我没有输出 vec4,nVidia 就会完全疯狂的风格......)。当然编译时没有任何错误,所以它很难修复......
但是现在,当我解决了大部分问题时,我正在努力解决一个我无法按照我的意愿解决的问题(可能有一些肮脏的方法,但是......这不是重点)。
简而言之:我在两个 GPU 上生成有效深度图,但在 nVidia GPU 上它不是灰度的,bur red-to-black scale这非常奇怪,因为同一台机器上的相同代码(几乎)应该运行相同(也相同的 API!)。由于这个事实,我的片段着色器可能没有赶上它,并且在 nVidia 上没有检测到被照亮的区域并且它完全黑暗(至少在聚光灯下,定向光不起作用)。
图片:
重要 - 请注意 GTX660m 上的深度图是 redToBlack 比例,而不是像 Intel GPU 上的灰度。顶部的一个来自定向光,底部的一个当然来自点光源。
我的 FragmentShader:#version 330 核心
in vec2 UV; //Coords for standard texture (model)
in vec4 ShadowCoord; //Coords for directional light (pos)
in vec4 POVShadowCoord; //Coords for spot light (flashlight) (pos)
out vec4 color; //Output color
uniform sampler2D myTextureSampler; //Standard texture with data for models
uniform sampler2D shadowMap; //Shadowmap for directional light
uniform sampler2D POVshadowMap; //Shadowmap for spot light (flashlight)
void main(){
vec3 tex_data = texture2D( myTextureSampler, UV ).rgb;
float bias = 0.005;
float visibility = 0.7;
float decrease = 0.002;
int early_bailing = 0;
if ( texture2D( shadowMap, ShadowCoord.xy + vec2(0,0)/1850.0 ).z < ShadowCoord.z-bias ) {
visibility -= decrease; early_bailing++;
}
if ( texture2D( shadowMap, ShadowCoord.xy + vec2(-2,-2)/1850.0 ).z < ShadowCoord.z-bias ) {
visibility -= decrease; early_bailing++;
}
if ( texture2D( shadowMap, ShadowCoord.xy + vec2(-2, 2)/1850.0 ).z < ShadowCoord.z-bias ) {
visibility -= decrease; early_bailing++;
}
if ( texture2D( shadowMap, ShadowCoord.xy + vec2( 2,-2)/1850.0 ).z < ShadowCoord.z-bias ) {
visibility -= decrease; early_bailing++;
}
if ( texture2D( shadowMap, ShadowCoord.xy + vec2( 2, 2)/1850.0 ).z < ShadowCoord.z-bias ) {
visibility -= decrease; early_bailing++;
}
if(early_bailing < 5) {
if(early_bailing > 0) {
for (int i=-2; i < 2; i++) {
for(int j = -2; j < 2; j++) {
if(i == 0 && j == 0) continue;
if(i == -2 && j == -2) continue;
if ( texture2D( shadowMap, ShadowCoord.xy + vec2(i,j)/850.0 ).z < ShadowCoord.z-bias )
visibility -= decrease;
}
}
}
} else {
visibility -= 14 * decrease;
}
float x = POVShadowCoord.x/POVShadowCoord.w;
float y = POVShadowCoord.y/POVShadowCoord.w;
bias = 0.0004;
if(x < 0 || x > 1 || y < 0 || y > 1) {
visibility -= 0.6;
} else {
float min_visibility = visibility - 0.6;
if ( textureProj( POVshadowMap, POVShadowCoord.xyw).z < (POVShadowCoord.z - bias)/POVShadowCoord.w) {
visibility = min_visibility;
} else {
//Flashlight effect
float dx = 0.5 - x;
float dy = 0.5 - y;
visibility -= sqrt(dx*dx + dy*dy);
if(visibility < min_visibility)
visibility = min_visibility;
}
}
color = vec4(visibility * tex_data, 1);
}
第一部分用于定向光 - 我在 5 个点中预采样深度图,如果所有点都相同,我不会进行更多采样(早期保释 - 很多性能优化!),或者如果有些不同,我会全部采样并计算当前片段上的阴影强度.
第二部分是简单地从点光深度图采样,然后我检查到光线中心的距离以模拟手电筒效果(中心更强)。
我认为不需要更多,但如果需要,请写,我会发布所需的代码。
还 - 阴影贴图只有 16 位精度(GL_DEPTH_COMPONENT16)英特尔 HD4000 比我的 GTX660m 更快(它更强大) - 这很奇怪。虽然我认为这是因为我不画任何高多边形,只是很多非常低的多边形。我对么?