6

我知道以下是一个模糊的问题,但我遇到了我在 XNA 中没有预料到的性能问题。

我有一个低多边形模型(它有 18 个面和 14 个顶点),我试图在屏幕上绘制(高!)次。在我绘制这个模型 5000 多次之前,我得到了超过 60 FPS(在一台像样的机器上)。我在这里问太多了吗?我非常希望至少将该数字增加一倍或三倍(10-15k)。

下面给出了我实际绘制模型的代码。我试图从绘制周期中消除尽可能多的计算,我可以从中挤出更多,还是更好的替代方案?

注意: tile.Offset 在初始化期间计算一次,而不是每个周期。

foreach (var tile in Tiles)
        {
            var myModel = tile.Model;
            Matrix[] transforms = new Matrix[myModel.Bones.Count];
            myModel.CopyAbsoluteBoneTransformsTo(transforms);

            foreach (ModelMesh mesh in myModel.Meshes)
            {
                foreach (BasicEffect effect in mesh.Effects)
                {
                    // effect.EnableDefaultLighting();
                    effect.World = transforms[mesh.ParentBone.Index] 
                                 * Matrix.CreateTranslation(tile.Offset);
                    effect.View = CameraManager.ViewMatrix;
                    effect.Projection = CameraManager.ProjectionMatrix;
                }
                mesh.Draw();
            }
        }
4

2 回答 2

15

你很明显达到了批量限制。有关详细信息,请参阅此演示文稿此答案以及此答案。简而言之:每秒可以向 GPU 提交的绘制调用数量是有限制的。

批次限制是基于 CPU 的限制,因此一旦您达到 5000 多个型号,您可能会看到您的 CPU 被固定。更糟糕的是,当您的游戏进行其他计算时,它会减少提交这些批次的可用 CPU 时间。

(重要的是要注意,相反,您几乎可以肯定没有达到 GPU 限制。无需担心网格复杂性。)

有多种方法可以减少批次计数。截锥体剔除就是其中之一。在您的情况下,最好的方法可能是Geometry Instancing,这使您可以在一个批次中绘制多个模型。这是一个执行此操作的XNA 示例

更好的是,如果它是静态几何体,您可以简单地将其全部烘焙到一个或几个大网格中吗?

于 2011-03-11T10:41:23.170 回答
3

与任何性能问题一样,特定方法的工作存在限制。您需要衡量并查看问题出在哪里。最好的选择是使用分析器,但即使是像查看 CPU 负载这样的基本测量也可能会显示你有什么瓶颈。

作为第一个调查步骤,我建议删除所有计算(如矩阵乘法)并看到你得到改进——这意味着 CPU 仍然比 GPU 做更多的工作。

确保您没有在调试版本上进行测量 - 如果它受 CPU 限制,它可能会使应用程序显着变慢。

旁注:当您相对不频繁地发送大型操作时,GPU 工作得最好。您的代码或多或少是相反的——发送大量非常小的绘图请求。您应该能够批处理基元并获得更好的性能。有关于如何渲染大量简单对象(包括 DirectX SDK 中的对象)的示例,搜索“gpu rendering crowds”可以为您提供起点。

于 2011-03-11T02:43:50.000 回答