4

我在某处读到,当渲染大量 3D 对象时,可以将它们合并形成一个巨大的网格,这样就只会进行一次绘制调用。因此,请引用:“GPU 发挥其魔力”,而CPU 可用于除绘图之外的其他调用。

所以对于我的问题,在考虑性能的2D 环境中这样做是否可行?

例如,假设我们有一个简单的图块系统,而不是为视图中的每个图块进行绘制调用,而是将所有图块合并成一个大精灵,然后在其上调用绘制。

由于我之前没有图形性能方面的经验,因此非常感谢您对此事的任何见解 - 无论是提示、链接还是诸如此类的东西。

编辑:对不起,我的解释很糟糕。我正在创建一个供个人使用的 tileengine,并希望它尽可能多才多艺。因此,我想进行优化,以防我在不久的将来必须绘制大量图块。

确实使用了一个 tilesheet,但我的意思是,如果将要从工作表中绘制的所有图块合并到一个新的 Texture2D 中是否会获得性能。例如:

我们在屏幕上绘制了 128x72 的图块。我们不是循环遍历所有图块并为要绘制的每个图块调用 draw,而是将所有图块合并为一个 1280x720 大小的新精灵并绘制它。这样,draw() 方法每帧只会被调用一次。我的问题是这是否会提高性能,因为它会在进行 3D 时将 3d 对象合并到单个网格中。

因为我收集到的信息是调用 draw() 是一种性能消耗,应该尽可能少地调用。有人确认或否认吗?:)

4

4 回答 4

11

我对 XNA 和 3D 没有任何经验,但我会给你一些关于 2D 游戏的建议。今年年初,我花了一些时间在 XNA 中创建了一个 tile 引擎,并且想知道同样的事情。我认为这里的简短回答是肯定的,如果您担心性能,将您的图块组合成一个更大的精灵是一个好主意。但是,如果您有兴趣,还有更长的答案。

一般来说,当谈到性能优化时,答案几乎总是“不要这样做”。如果您确定需要针对性能进行优化,那么下一个答案几乎总是“不要这样做”。最后,如果您确实尝试优化性能,您可以做的最重要的事情是使用基准来收集更改前后性能的精确测量值。没有它,你不知道你是否成功!

现在,更多地与 2D 游戏相关,我了解到我在我的 tile 引擎中看到了更好的性能,我切换纹理的次数越少。例如,假设我有一个草瓦和一个砾石瓦。如果这是内存中的两个独立纹理,我在屏幕上绘制一个草瓦,然后是砾石瓦,然后是草瓦,GPU 将加载草纹理,然后将其切换为加载砾石纹理,然后切换草纹理回到绘制另一个草瓷砖。这会很快杀死性能!解决这个问题的最简单方法是使用 spritesheet,将草和砾石瓷砖放入一个纹理中,然后告诉 SpriteBatch 每次从同一纹理上的不同区域绘制。

另一件要考虑的事情是您将一次在屏幕上绘制多少个图块。我不记得具体了,但我一次绘制了数千个图块(在缩小的视图中)。我注意到,正如您在问题中所建议的那样,当我使用更大的瓷砖并减少它们的数量时,性能也得到了改善。不过,这并没有我在上一段中描述的那么大的改进,我仍然鼓励您衡量不同实现带来的性能变化。此外,如果您只绘制十几个或几百个图块,那么现在尝试优化它可能不值得(参见第 2 段)。

只是为了让你知道我没有完全编造这个,这里有一个链接,指向 Shawn Hargreaves 关于纹理交换、spritesheets 等的帖子。如果你在 XNA 论坛和 Shawn Hargreaves 的博客上搜索,可能会有更好的帖子话题。

http://forums.xna.com/forums/p/24254/131437.aspx#131437

更新:

既然你更新了你的问题,让我更新我的帖子。我决定只对一些样本进行基准测试,让您了解性能差异可能是什么。在我的 Draw() 函数中,我有以下内容:

        GraphicsDevice.Clear(Color.CornflowerBlue);

        Stopwatch sw = new Stopwatch();
        sw.Start();

        spriteBatch.Begin();

#if !DEBUG
        spriteBatch.Draw(tex, new Rectangle(0, 0, 
                         GraphicsDevice.Viewport.Width,
                         GraphicsDevice.Viewport.Height), 
                         Color.White);            
#else
        for (int i = 0; i < 128; i++)
            for (int j = 0; j < 72; j++)
            {
                Rectangle r = new Rectangle(i * 10, j * 10, 10, 10);
                spriteBatch.Draw(tex, r, r, Color.White);
            }
#endif
        spriteBatch.End();

        sw.Stop();

        if (draws > 60)
        {
            numTicks += sw.ElapsedTicks;
        }
        draws++;

        if (draws % 100 == 0)
            Console.WriteLine("avg ticks: " + numTicks / (draws - 60));

        base.Draw(gameTime);

只需在“#if !DEBUG”语句中删除感叹号即可在两种方法之间切换。我跳过了前 60 次抽签,因为它们包含了一些初始设置(不太确定是什么)并且扭曲了平均值。我下载了一张 1280x720 的图片,对于顶级测试用例,我只画了一次。对于底部测试用例,我在瓷砖中绘制了一个源图像,128x72 就像您在问题中询问的那样。这是结果。

绘制一张图片:

avg ticks: 68566
avg ticks: 73668
avg ticks: 82659
avg ticks: 81654
avg ticks: 81104
avg ticks: 84664
avg ticks: 86626
avg ticks: 88211
avg ticks: 87677
avg ticks: 86694
avg ticks: 86713
avg ticks: 88116
avg ticks: 89380
avg ticks: 92158

绘制 128x72 瓷砖:

avg ticks: 7902592
avg ticks: 8052819
avg ticks: 8012696
avg ticks: 8008819
avg ticks: 7985545
avg ticks: 8028217
avg ticks: 8046837
avg ticks: 8291755
avg ticks: 8309384
avg ticks: 8336120
avg ticks: 8320260
avg ticks: 8322150
avg ticks: 8381845
avg ticks: 8364629

正如你所看到的,那里有几个数量级的差异,所以它非常重要。测试这种东西非常简单,我建议您针对您的特定设置运行自己的基准测试,以考虑到我可能错过的一些东西。

于 2009-10-28T21:02:24.383 回答
3

显卡切换纹理的次数越少,性能就越好。如果您愿意,您可以在 SpriteBatch.Begin() 方法中按纹理排序,以便显卡尽可能少地切换纹理。

当有意义时,我将我的瓷砖/精灵放入床单中。例如,一个字符可能在一张纸上,而一层瓷砖可能在同一张纸上。到目前为止,这工作得很好。

我会说,除非你不得不优化,否则不要优化。如果您的游戏运行得足够快,那么为什么还要进行优化。

于 2009-10-29T13:13:17.903 回答
1

矩形 r = new Rectangle(i * 10, j * 10, 10, 10);

创建许多新对象将调用垃圾收集,这会减慢很多!你不应该在大循环中分配新对象:

于 2012-10-18T01:52:02.640 回答
0

表现不是普遍的命令或来自上帝的诫命;这是达到目的的手段。如果您所拥有的性能足够好,那么您实际上无法从提高其性能中获得任何收益。保持“始终保持最佳性能”是过早优化的定义,它会引起比它防止的更多的麻烦。

于 2010-08-16T18:33:18.890 回答