4

我正在使用 System.Runtime.InteropServices.DllImportAttribute 测试从 C# 中的 dll 调用 C 代码的速度。C 函数生成一个自定义结构,用值填充它,执行计算,然后返回结果。这个过程我在一个循环中重复了数十万次,我记录了循环之前和循环之后的滴答数。然后我在直接的 C# 中制作了完全相同的函数并重复了这个试验。直接的 C# 方法比使用非托管 DLL 快得多。为什么?似乎没有不受管理的速度增益。

c2cstest.c

#include <stdio.h>
struct test {
double a;
double b;
double c;
};
_declspec(dllexport) double myCfunction(double input) {
struct test one;
one.a = input;
one.b = one.a * one.a;
one.c = one.b * one.a;
return one.c;
}

cl /LD cscstest.c runCcode.cs

using System;
using System.Runtime.InteropServices;
class test
{
[DllImport("c2cstest.dll")]
public static extern double myCfunction (double input);
static void Main()
{
double x = 5.25;
double result = 0.0;
long tick1 = DateTime.Now.Ticks;
for(int y = 100000; y > 0; y--)
{
result = myCfunction(x);
}
long tick2 = DateTime.Now.Ticks;
Console.WriteLine("Answer is {0}.  Dllimport took {1} ticks.", result, tick2-tick1);
}
}

输出:答案是 144.703125。Dllimport 花费了 250000 个滴答声。运行CScode.cs

using System;
using System.Runtime.InteropServices;
struct test
{
public double a;
public double b;
public double c;
}
class testclass
{
double Mycsfunction (double input)
{
test one;
one.a = input;
one.b = one.a * one.a;
one.c = one.b * one.a;
return one.c;
}
static void Main()
{
double x = 5.25;
double result = 0.0;
testclass ex = new testclass();
long tick1 = DateTime.Now.Ticks;
for(int y = 100000; y > 0; y--)
{
result = ex.Mycsfunction(x);
}
long tick2 = DateTime.Now.Ticks;
Console.WriteLine("Answer is {0}.  Straight CS took {1} ticks.", result, tick2-tick1);
}}

输出:答案是 144.703125。直接 CS 需要 50000 个滴答声。

补充:在尝试了各种方法后,我得出了与调用非托管代码技术这个家伙相同的结论,尽管他尝试的方法比我多。

结论:直接简单的函数调用是不值得的(特别是当它们被循环时)。将循环放在非托管函数中肯定会有所帮助。非常大的功能可能是值得的。无论您尝试多少种不同的方法,编组都不是一种有效的技术。

4

1 回答 1

2

基准很难正确;我认为,尤其是微基准。一方面,您并没有在直接的 C# 测试中测量您认为自己是什么——编译器(或者可能是抖动)认识到结果是循环不变的,因此它只运行循环一次。

这是我的机器上的结果,你runCScode.cs没有改变:

c:\temp>csc runCScode.cs
Microsoft (R) Visual C# 2010 Compiler version 4.0.30319.1
Copyright (C) Microsoft Corporation. All rights reserved.


c:\temp>runCScode
Answer is 144.703125.  Straight CS took 10001 ticks.

for以下是注释掉循环行的结果:

c:\temp>csc runCScode.noloop.cs
Microsoft (R) Visual C# 2010 Compiler version 4.0.30319.1
Copyright (C) Microsoft Corporation. All rights reserved.


c:\temp>runCScode.noloop
Answer is 144.703125.  Straight CS took 10001 ticks.

我认为运行那段代码曾经花了这么长时间很奇怪,所以我猜想由于DateTime某种原因实际获取值存在一些开销(我不知道为什么 - 这只是一个猜测)。实际上,我很惊讶非循环在任何时候都需要,因为我猜到编译器会将整个事情归结为将一个常量值移动到result. 所以,我在初始化之后添加了以下行tick1

tick1 = DateTime.Now.Ticks;

是的,没错 - 我刚刚重新tick1加载DateTime.Now.Ticks

然后我再次运行测试:

c:\temp>runCScode.noloop
Answer is 144.703125.  Straight CS took 0 ticks.

(注意:公平地说,在我运行未重新加载的基准测试的大约三分之一的时间中,tick1我的计数为 0。但大多数运行的计数为 10000+/-1。重新加载的版本tick1总是报告计数为 0 滴答声)。

也就是说,正如一些人在评论中指出的那样,没有期望 C 在所有方面都比 C# 快得多,并且对于调用 C 函数的小型操作将产生由 P/Invoke 和参数/结果强加的开销编组。您还将失去对抖动执行优化的机会。所以,我认为底线是不要担心在 .NET 应用程序中使用 C 来提高性能,除非你有一个需要更快的领域,并且你有理由相信原生 C 或 C++ 可以给你一些东西无法从 C#(或 C++/CLI)获取。

这个原因不会是一些浮点运算。

最后,我认为应该说调用 C 或 C++ DLL 的主要原因之一不一定是为了性能。这是因为在您想要使用的本机 DLL 中存在一个库(甚至是单个 API),而该功能在 .NET 类中不可用。

于 2012-05-03T05:11:43.667 回答