我注意到了
string1.Length == string2.Length && string1 == string2
在大弦上比仅仅快一点
string1 == string2
这是真的?这是在比较实际字符串之前比较大字符串长度的好习惯吗?
我注意到了
string1.Length == string2.Length && string1 == string2
在大弦上比仅仅快一点
string1 == string2
这是真的?这是在比较实际字符串之前比较大字符串长度的好习惯吗?
string
s 运算符 equals 在比较字符之前进行长度检查。所以你不要用这个技巧保存内容的比较。您可能仍会节省一些 CPU 周期,因为您的长度检查假定字符串不为空,而 BCL 必须检查这一点。因此,如果大部分时间长度不相等,您将短路一些指令。
不过,我在这里可能是错的。也许操作员会内联并优化检查。谁肯定知道?(测量者。)
如果您关心保存每个周期,您可能应该首先使用不同的策略。也许托管代码甚至不是正确的选择。鉴于此,我建议使用较短的形式,而不是使用附加检查。
String.Equality 运算符或 ==
内部调用string.Equals
,因此使用string.Equals
或==
由框架提供。它已经足够优化了。
它首先比较引用,然后是长度,然后是实际字符。
你可以在这里找到源代码
代码:(来源: http: //www.dotnetframework.org/default.aspx/4@0/4@0/DEVDIV_TFS/Dev10/Releases/RTMRel/ndp/clr/src/BCL/System/String@cs/1305376 /字符串@cs )
// Determines whether two strings match.
[ReliabilityContract(Consistency.WillNotCorruptState, Cer.MayFail)]
public override bool Equals(Object obj) {
if (this == null) //this is necessary to guard against reverse-pinvokes and
throw new NullReferenceException(); //other callers who do not use the callvirt instruction
String str = obj as String;
if (str == null)
return false;
if (Object.ReferenceEquals(this, obj))
return true;
return EqualsHelper(this, str);
}
和
[System.Security.SecuritySafeCritical] // auto-generated
[ReliabilityContract(Consistency.WillNotCorruptState, Cer.MayFail)]
private unsafe static bool EqualsHelper(String strA, String strB)
{
Contract.Requires(strA != null);
Contract.Requires(strB != null);
int length = strA.Length;
if (length != strB.Length) return false;
fixed (char* ap = &strA.m_firstChar) fixed (char* bp = &strB.m_firstChar)
{
char* a = ap;
char* b = bp;
// unroll the loop
#if AMD64
// for AMD64 bit platform we unroll by 12 and
// check 3 qword at a time. This is less code
// than the 32 bit case and is shorter
// pathlength
while (length >= 12)
{
if (*(long*)a != *(long*)b) break;
if (*(long*)(a+4) != *(long*)(b+4)) break;
if (*(long*)(a+8) != *(long*)(b+8)) break;
a += 12; b += 12; length -= 12;
}
#else
while (length >= 10)
{
if (*(int*)a != *(int*)b) break;
if (*(int*)(a+2) != *(int*)(b+2)) break;
if (*(int*)(a+4) != *(int*)(b+4)) break;
if (*(int*)(a+6) != *(int*)(b+6)) break;
if (*(int*)(a+8) != *(int*)(b+8)) break;
a += 10; b += 10; length -= 10;
}
#endif
// This depends on the fact that the String objects are
// always zero terminated and that the terminating zero is not included
// in the length. For odd string sizes, the last compare will include
// the zero terminator.
while (length > 0)
{
if (*(int*)a != *(int*)b) break;
a += 2; b += 2; length -= 2;
}
return (length <= 0);
}
}
对于我们中间的极客来说,这里有一个页面,它在对多种比较字符串的方法进行基准测试方面做得很好。
简而言之,最快的方法似乎是 CompareOrdinal:
if (string.CompareOrdinal(stringsWeWantToSeeIfMatches[x], stringsWeAreComparingAgainst[x]) == 0)
{
//they're equal
}
第二种最佳方法似乎是使用 Dictionary 或 Hashset 并将“key”作为您要比较的字符串。
读起来很有趣。
我的测试结果
将 10000 个字符串与 10000 个长度相同的其他字符串进行比较 (256)
时间(s1 == s2):32536889 滴答
时间 (s1.Length == s2.Length) && (s1 == s2): 37380529 滴答
将 10000 个字符串与 10000 个其他字符串进行比较随机长度最大 256
时间(s1 == s2):27223517 滴答
时间(s1.Length == s2.Length)&&(s1 == s2):23419529 滴答
将 10000 个字符串与 10000 个其他字符串进行比较 随机长度 min 256 max 512
时间(s1 == s2):28904898 滴答
时间 (s1.Length == s2.Length) && (s1 == s2): 25442710 滴答
我发现令人难以置信的是,比较 10000 个相等长度的字符串比比较相同数量的更大数据需要更长的时间。
所有这些测试都是用完全相同的数据完成的。
根据 ILSpy,字符串==
运算符定义为:
public static bool operator ==(string a, string b)
{
return string.Equals(a, b);
}
定义为
public static bool Equals(string a, string b)
{
return a == b || (a != null && b != null && a.Length == b.Length && string.EqualsHelper(a, b));
}
我假设 firsta == b
实际上是一个引用相等检查(ILSpy 只是将其呈现为==
),否则这将是一个无限递归的方法。
这意味着==
在实际比较它们的字符之前已经检查了字符串的长度。
在终止的字符串中,开始比较字符是有意义的,因为如果不迭代所有字符就无法计算字符串长度,并且比较可能会提前退出。
对于按长度计算的字符串,如果您正在测试字节相等性,则应首先比较长度。如果不检索长度,您甚至无法开始访问字符数据,因为长度可能为零。
如果您正在进行关系比较,知道长度不同并不能告诉您结果应该是正数还是负数。在文化感知比较中,相等的字符串并不意味着相等的长度。因此,对于这两者,您只需要比较数据。
如果operator==(string, string)
只是委托给一个关系比较,你不会期望它来比较长度。因此,在进行比较之前检查长度可能是一个好处。但似乎框架确实从长度检查开始。
所以正如我承诺的那样,我用秒表写了一个简短的代码 - 你可以复制粘贴它并尝试不同的字符串并查看差异
class Program
{
static void Main(string[] args)
{
string str1 = "put the first value";
string str2 = "put the second value";
CompareTwoStringsWithStopWatch(str1, str2); //Print the results.
}
private static void CompareTwoStringsWithStopWatch(string str1, string str2)
{
Stopwatch stopwatch = new Stopwatch();
stopwatch.Start();
for (int i = 0; i < 99999999; i++)
{
if (str1.Length == str2.Length && str1 == str2)
{
SomeOperation();
}
}
stopwatch.Stop();
Console.WriteLine("{0}. Time: {1}", "Result for: str1.Length == str2.Length && str1 == str2", stopwatch.Elapsed);
stopwatch.Reset();
stopwatch.Start();
for (int i = 0; i < 99999999; i++)
{
if (str1 == str2)
{
SomeOperation();
}
}
stopwatch.Stop();
Console.WriteLine("{0}. Time: {1}", "Result for: str1 == str2", stopwatch.Elapsed);
}
private static int SomeOperation()
{
var value = 500;
value += 5;
return value - 300;
}
}
我的结论:
我会说第一个更快的是结果string1.Length == string2.Length
是错误的。多亏了短路评估 (SCE),因此不会进行字符串之间的实际比较,这可能会节省您的时间。
但是,如果字符串相等,则第一个较慢,因为它将首先检查长度,然后执行与第二个相同的操作。
有关运营商和 SCE的信息,请参阅http://msdn.microsoft.com/en-us/library/2a723cdk.aspx 。&&
如果您希望字符串在大多数情况下的长度不同,您可以比较它们的长度,然后使用 比较字符串本身string.Compare
。通过这样做,我获得了近 50% 的性能提升:
if (str1.Length == str2.Length)
{
if (string.Compare(str1, str2, StringComparison.Ordinal) == 0)
{
doSomething()
}
}
在这种情况下,我希望字符串几乎一直都不同,我认为 str1.Lenght 比比较实际字符串便宜得多。如果它们的大小相等,我会比较它们。
编辑:忘记我说的话。只需使用==
并快乐。