15

我正在运行一些使用的 C# 代码,System.Numerics.Vector<T>但据我所知,我没有获得 SIMD 内在函数的全部好处。我正在使用带有 Update 1 的 Visual Studio Community 2015,而我的 clrjit.dll 是 v4.6.1063.1。

我在Intel Core i5-3337U Processor上运行,它实现了 AVX 指令集扩展。因此,我认为,我应该能够在 256 位寄存器上执行大多数 SIMD 指令。例如,反汇编应该包含像vmovups, vmovupd, vaddups, 等等这样的指令,并且Vector<float>.Count应该返回 8,Vector<double>.Count应该是 4 等等......但这不是我所看到的。

相反,我的反汇编包含指令,如movups, movupd,addups等......以及以下代码:

WriteLine($"{Vector<byte>.Count} bytes per operation");
WriteLine($"{Vector<float>.Count} floats per operation");
WriteLine($"{Vector<int>.Count} ints per operation");
WriteLine($"{Vector<double>.Count} doubles per operation");

产生:

16 bytes per operation
4 floats per operation
4 ints per operation
2 doubles per operation

我哪里错了?要查看所有项目设置等,该项目可在此处获得。

4

1 回答 1

12

你的处理器有点过时了,它的微架构是 Ivy Bridge。Sandy Bridge 的“tock”,在没有建筑变化的情况下缩小了特征。您的克星是 RyuJIT 中的这段代码,位于 ee_il_dll.cpp, CILJit::getMaxIntrinsicSIMDVectorLength() 函数中:

if (((cpuCompileFlags & CORJIT_FLG_PREJIT) == 0) &&
    ((cpuCompileFlags & CORJIT_FLG_FEATURE_SIMD) != 0) &&
    ((cpuCompileFlags & CORJIT_FLG_USE_AVX2) != 0))
{
    static ConfigDWORD fEnableAVX;
    if (fEnableAVX.val(CLRConfig::EXTERNAL_EnableAVX) != 0)
    {
        return 32;
    }
}

注意 CORJIT_FLG_USE_AVX2 的使用。您的处理器尚不支持 AVX2,该扩展已在 Haswell 中可用。Ivy Bridge 之后的下一个微架构,一个“tick”。顺便说一句,非常好的处理器,像这样的发现有一个主要的令人惊叹的因素。

除了去购物,你无能为力。为了获得灵感,您可以查看它在这篇文章中生成的代码类型。

于 2016-01-20T11:00:05.223 回答