我在业余时间用 C# 编写了这个时髦的小 2D N 体模拟。它在串行实现中运行良好,以良好的帧速率运行到大约 1000 个物体,此时它开始滞后。
我修改了算法以在单独的块中进行位置和速度更新,以在 CPU 的单独内核上运行,我注意到性能有一个小的改进。
请注意,很多时间都花在了实际的数学运算上,也有一点时间花在了场景的实际绘制上。
我刚刚下载了 Microsoft Accelerator V2 库并从头开始重新编写了整个代码以使用它。它像以前一样工作,但速度明显变慢!以前我可以得到近 1000 分才能顺利运行,而现在我在 Accelerator 下只能得到大约 10 分。
这是我的代码。这是我第一次用 Accelerator 做任何事情,所以很可能我搞砸了。
之所以叫这门课,是Test
因为这是我的第一次测试。n
构造函数只是为物体的 x 和 y 位置、它们的 x 和 y 速度以及它们的质量创建长度数组。dec
只是一个阻尼因子,因此舍入误差会使其内爆而不是爆炸,并且g
只是我现在要离开的引力常数1.0f
。
Tick()
是执行所有更新的函数。我首先考虑任何给定点 i 的所有点,找到半径,在其他点的方向上构造一个单位向量,通过减速度和重力常数缩放该单位向量,然后求和到 x 和 y 速度更新对于这一点。
然后我更新所有速度和所有位置,并转换回float[]
s。
正如我所说,代码在技术上确实有效。结果与我的串行实现相同,但速度大幅下降。
有什么想法我可能做错了吗?
我有一种感觉,它可能是第 85 行和第 86 行——我将点 i 的 x 和 y 速度更新相加,并将其存储到我的浮点数组中,这意味着我需要调用Target.ToArray1D()[0]
以获取总和值。
我这样做的原因是我首先更新所有点,然后更新点,然后根据速度应用位置更改。
即我不希望在时间t + 1我用时间 t 的其余点更新点0 ,然后在时间t用其余点再次更新点1 ,但用新的 t 更新点0 + 1。如果这是有道理的。
public void Tick()
{
FPA fxPos = new FPA(xPos);
FPA fyPos = new FPA(yPos);
FPA fxVel = new FPA(xVel);
FPA fyVel = new FPA(yVel);
FPA fMass = new FPA(mass);
float[] xUpd = new float[n]; // x-update for velocity
float[] yUpd = new float[n]; // y-update for velocity
for (int i = 0; i < n; i++)
{
// x- and y-pos about point i:
FPA ixPos = PA.Subtract(fxPos, xPos[i]);
FPA iyPos = PA.Subtract(fyPos, yPos[i]);
// radius from point i:
FPA iRad = PA.Sqrt(PA.Add(PA.Multiply(ixPos, ixPos), PA.Multiply(iyPos, iyPos)));
// x- and y-pos are now unit vectors:
ixPos = PA.Divide(ixPos, iRad);
iyPos = PA.Divide(iyPos, iRad);
// vectors are now scaled by mass:
ixPos = PA.Multiply(fMass, ixPos);
iyPos = PA.Multiply(fMass, iyPos);
// vectors are now scaled by G and deceleration:
ixPos = PA.Multiply(dec * g, ixPos);
iyPos = PA.Multiply(dec * g, iyPos);
// sum to get ith update value:
xUpd[i] = target.ToArray1D(PA.Sum(ixPos))[0];
yUpd[i] = target.ToArray1D(PA.Sum(iyPos))[0];
}
FPA fxUpd = new FPA(xUpd);
FPA fyUpd = new FPA(yUpd);
// update velocities:
fxVel = PA.Add(fxUpd, fxVel);
fyVel = PA.Add(fyUpd, fyVel);
// update positions:
fxPos = PA.Add(fxVel, fxPos);
fyPos = PA.Add(fyVel, fyPos);
xPos = target.ToArray1D(fxPos);
yPos = target.ToArray1D(fyPos);
xVel = target.ToArray1D(fxVel);
yVel = target.ToArray1D(fyVel);
}