2

仍在进行我的 F# 性能测试并尝试使基于堆栈的数组正常工作。有关更多背景信息,请参见此处:f# NativePtr.stackalloc in Struct Constructor

据我了解,每个函数调用都应该在堆栈中获得自己的框架。然后在返回时通过将堆栈指针移回来释放此内存。然而,下面会导致堆栈溢出错误 - 不确定为什么在函数内部执行 stackalloc。

有趣的是,这只发生在发布模式下,而不是调试模式下。

我相信 dotnet 中的标准堆栈大小是 1MB,我还没有调整我的。我希望分配 8192 个整数(32768 字节)不会破坏堆栈。

#nowarn "9"

module File1 =

    open Microsoft.FSharp.NativeInterop
    open System
    open System.Diagnostics    

    let test () =
        let stackAlloc x =
            let mutable ints:nativeptr<int> = NativePtr.stackalloc x
            ()

        let size = 8192            
        let reps = 10000
        let clock = Stopwatch()
        clock.Start()
        for i = 1 to reps do            
            stackAlloc size
        let elapsed = clock.Elapsed.TotalMilliseconds
        let description = "NativePtr.stackalloc"
        Console.WriteLine("{0} ({1} ints, {2} reps): {3:#,##0.####}ms", description, size, reps, elapsed)

    [<EntryPoint>]
    let main argv = 
        printfn "%A" argv
        test ()
        Console.ReadKey() |> ignore
        0

更新 按照 Fyodor Soikin 的建议使用 ILSpy 进行反编译后,我们可以看到在优化期间发生了内联。有点酷,有点吓人!

using Microsoft.FSharp.Core;
using System;
using System.Diagnostics;
using System.IO;

[CompilationMapping(SourceConstructFlags.Module)]
public static class File1
{
    public unsafe static void test()
    {
        Stopwatch clock = new Stopwatch();
        clock.Start();
        for (int i = 1; i < 10001; i++)
        {
            IntPtr intPtr = stackalloc byte[8192 * sizeof(int)];
        }
        double elapsed = clock.Elapsed.TotalMilliseconds;
        Console.WriteLine("{0} ({1} ints, {2} reps): {3:#,##0.####}ms", "NativePtr.stackalloc", 8192, 10000, elapsed);
    }

    [EntryPoint]
    public static int main(string[] argv)
    {
        PrintfFormat<FSharpFunc<string[], Unit>, TextWriter, Unit, Unit> format = new PrintfFormat<FSharpFunc<string[], Unit>, TextWriter, Unit, Unit, string[]>("%A");
        PrintfModule.PrintFormatLineToTextWriter<FSharpFunc<string[], Unit>>(Console.Out, format).Invoke(argv);
        File1.File1.test();
        ConsoleKeyInfo consoleKeyInfo = Console.ReadKey();
        return 0;
    }
}

除此之外,可能会感兴趣以下内容:

http://www.hanselman.com/blog/ReleaseISNOTDebug64bitOptimizationsAndCMethodInliningInReleaseBuildCallStacks.aspx

也可以使用属性调整优化:

https://msdn.microsoft.com/en-us/library/system.runtime.compilerservices.methodimploptions(v=vs.110).aspx?cs-save-lang=1&cs-lang=fsharp#code-snippet-1

4

1 回答 1

4

如果您的stackAlloc函数被内联,则会发生这种情况,从而导致 stackalloc 在test' 框架内发生。这也解释了为什么它只会在 Release 中发生:内联是一种优化,在 Debug 中执行的力度要小于 Release。

为了确认这一点,我会尝试使用 ILSpy 查看您生成的代码。

为什么首先需要使用堆栈分配的数组?这看起来与 Donald Knuth 警告我们的事情一模一样。:-)

于 2016-02-18T03:35:29.063 回答