567

注意:这似乎已在Roslyn中修复

这个问题是在写我对这个问题的回答时出现的,它谈到了null-coalescing operator的关联性。

提醒一下,null-coalescing 运算符的想法是形式的表达式

x ?? y

首先评估x,然后:

  • 如果 的值为x空,y则进行评估,这是表达式的最终结果
  • 如果 的值x为空,y不计算,并且 的值是表达式的最终结果,则在必要时转换为编译时类型xy

现在通常不需要转换,或者它只是从可空类型到不可空类型 - 通常类型是相同的,或者只是从(比如说)int?int. 但是,您可以创建自己的隐式转换运算符,并在必要时使用这些运算符。

对于 的简单情况x ?? y,我没有看到任何奇怪的行为。但是,(x ?? y) ?? z我看到一些令人困惑的行为。

这是一个简短但完整的测试程序 - 结果在评论中:

using System;

public struct A
{
    public static implicit operator B(A input)
    {
        Console.WriteLine("A to B");
        return new B();
    }

    public static implicit operator C(A input)
    {
        Console.WriteLine("A to C");
        return new C();
    }
}

public struct B
{
    public static implicit operator C(B input)
    {
        Console.WriteLine("B to C");
        return new C();
    }
}

public struct C {}

class Test
{
    static void Main()
    {
        A? x = new A();
        B? y = new B();
        C? z = new C();
        C zNotNull = new C();

        Console.WriteLine("First case");
        // This prints
        // A to B
        // A to B
        // B to C
        C? first = (x ?? y) ?? z;

        Console.WriteLine("Second case");
        // This prints
        // A to B
        // B to C
        var tmp = x ?? y;
        C? second = tmp ?? z;

        Console.WriteLine("Third case");
        // This prints
        // A to B
        // B to C
        C? third = (x ?? y) ?? zNotNull;
    }
}

所以我们有三种自定义值类型,ABC以及从 A 到 B、A 到 C 和 B 到 C 的转换。

我可以理解第二种情况和第三种情况......但是为什么在第一种情况下会有额外的 A 到 B 转换?特别是,我真的希望第一种情况和第二种情况是同一件事——毕竟它只是将一个表达式提取到一个局部变量中。

有没有人知道发生了什么?当谈到 C# 编译器时,我非常犹豫要喊“错误”,但我对发生的事情感到困惑......

编辑:好的,这是一个更糟糕的例子,感谢配置器的回答,这让我有更多理由认为这是一个错误。编辑:该示例现在甚至不需要两个空合并运算符...

using System;

public struct A
{
    public static implicit operator int(A input)
    {
        Console.WriteLine("A to int");
        return 10;
    }
}

class Test
{
    static A? Foo()
    {
        Console.WriteLine("Foo() called");
        return new A();
    }

    static void Main()
    {
        int? y = 10;

        int? result = Foo() ?? y;
    }
}

这个的输出是:

Foo() called
Foo() called
A to int

Foo()在这里被调用两次的事实让我非常惊讶——我看不出有任何理由让表达式被计算两次。

4

5 回答 5

429

感谢所有为分析此问题做出贡献的人。这显然是一个编译器错误。它似乎只发生在合并运算符左侧涉及两个可空类型的提升转换时。

我还没有确定到底哪里出了问题,但是在编译的“可空降低”阶段的某个时刻——在初始分析之后但在代码生成之前——我们减少了表达式

result = Foo() ?? y;

从上面的例子到道德上的等价物:

A? temp = Foo();
result = temp.HasValue ? 
    new int?(A.op_implicit(Foo().Value)) : 
    y;

显然这是不正确的;正确的降低是

result = temp.HasValue ? 
    new int?(A.op_implicit(temp.Value)) : 
    y;

到目前为止,根据我的分析,我最好的猜测是可空优化器在这里偏离了轨道。我们有一个可为 null 的优化器,它查找我们知道可为 null 类型的特定表达式不可能为 null 的情况。考虑以下简单的分析:我们可以先说

result = Foo() ?? y;

是相同的

A? temp = Foo();
result = temp.HasValue ? 
    (int?) temp : 
    y;

然后我们可以说

conversionResult = (int?) temp 

是相同的

A? temp2 = temp;
conversionResult = temp2.HasValue ? 
    new int?(op_Implicit(temp2.Value)) : 
    (int?) null

但是优化器可以介入并说“哇,等一下,我们已经检查了 temp 不为空;没有必要因为我们调用提升的转换运算符而第二次检查它是否为空”。我们让他们将其优化为

new int?(op_Implicit(temp2.Value)) 

我的猜测是,我们在某个地方缓存了优化形式(int?)Foo()new int?(op_implicit(Foo().Value))但实际上不是我们想要的优化形式的事实;我们想要 Foo()-replaced-with-temporary-and-then-converted 的优化形式。

C# 编译器中的许多错误都是由于错误的缓存决策造成的。对智者的一句话:每次你缓存一个事实供以后使用时,如果相关的东西发生变化,你可能会造成不一致。在这种情况下,初始分析后改变的相关事情是对 Foo() 的调用应始终实现为临时获取。

我们在 C# 3.0 中对可为空的重写过程进行了大量重组。该错误在 C# 3.0 和 4.0 中重现,但在 C# 2.0 中没有重现,这意味着该错误可能是我的错误。对不起!

我会在数据库中输入一个错误,我们会看看我们是否可以为该语言的未来版本修复这个错误。再次感谢大家的分析;这很有帮助!

更新:我从头开始为 Roslyn 重写了可为空的优化器;它现在做得更好,并避免了这些奇怪的错误。有关 Roslyn 中的优化器如何工作的一些想法,请参阅我从这里开始的系列文章:https ://ericlippert.com/2012/12/20/nullable-micro-optimizations-part-one/

于 2011-06-07T21:01:09.797 回答
84

这绝对是一个错误。

public class Program {
    static A? X() {
        Console.WriteLine("X()");
        return new A();
    }
    static B? Y() {
        Console.WriteLine("Y()");
        return new B();
    }
    static C? Z() {
        Console.WriteLine("Z()");
        return new C();
    }

    public static void Main() {
        C? test = (X() ?? Y()) ?? Z();
    }
}

此代码将输出:

X()
X()
A to B (0)
X()
X()
A to B (0)
B to C (0)

这让我觉得每个??合并表达式的第一部分都被评估了两次。这段代码证明了这一点:

B? test= (X() ?? Y());

输出:

X()
X()
A to B (0)

这似乎只在表达式需要在两个可空类型之间进行转换时才会发生;我尝试了各种排列,其中一侧是字符串,但没有一个导致这种行为。

于 2011-06-06T20:17:41.707 回答
55

如果您查看为 Left-grouped 案例生成的代码,它实际上会执行以下操作 ( csc /optimize-):

C? first;
A? atemp = a;
B? btemp = (atemp.HasValue ? new B?(a.Value) : b);
if (btemp.HasValue)
{
    first = new C?((atemp.HasValue ? new B?(a.Value) : b).Value);
}

另一个发现,如果你使用 它,如果两者都为 null 和 return ,first它将生成一个快捷方式。然而,如果or是非空的,它会作为隐式转换的一部分重新评估,然后返回哪个or是非空的。abcabaBab

来自 C# 4.0 规范,§6.1.4:

  • 如果可以为空的转换是 fromS?T?
    • 如果源值为null( HasValueproperty is false),则结果为nulltype 的值T?
    • 否则,转换被评估为从S?to的展开,然后是从toS的基础转换,然后是从StoT的包装(第 4.1.10 节)。TT?

这似乎解释了第二个展开-包裹组合。


C# 2008 和 2010 编译器生成非常相似的代码,但这看起来像是 C# 2005 编译器 (8.00.50727.4927) 的回归,它为上述生成以下代码:

A? a = x;
B? b = a.HasValue ? new B?(a.GetValueOrDefault()) : y;
C? first = b.HasValue ? new C?(b.GetValueOrDefault()) : z;

我想知道这是否不是由于类型推理系统的额外魔法?

于 2011-06-06T19:15:23.290 回答
17

实际上,我现在将其称为错误,并提供更清晰的示例。这仍然成立,但双重评价肯定不好。

好像A ?? B被实现为A.HasValue ? A : B. 在这种情况下,也有很多转换(遵循三元?:运算符的常规转换)。但是,如果您忽略所有这些,那么根据它的实现方式,这是有道理的:

  1. A ?? B 扩展到A.HasValue ? A : B
  2. A是我们的 x ?? y。扩大到x.HasValue : x ? y
  3. 替换所有出现的 A -> (x.HasValue : x ? y).HasValue ? (x.HasValue : x ? y) : B

在这里你可以看到它x.HasValue被检查了两次,如果x ?? y需要强制转换,x将被强制转换两次。

我会把它简单地看作是如何??实现的工件,而不是编译器错误。 要点:不要创建具有副作用的隐式转换运算符。

这似乎是一个围绕如何??实现的编译器错误。要点:不要嵌套具有副作用的合并表达式。

于 2011-06-06T19:40:28.573 回答
11

从我的问题历史中可以看出,我根本不是 C# 专家,但是,我试过了,我认为这是一个错误....但作为一个新手,我不得不说我不明白一切在这里,如果我离开了,我会删除我的答案。

bug通过制作处理相同场景的不同版本的程序来得出这个结论,但要简单得多。

我将三个空整数属性与后备存储一起使用。我将每个设置为 4 然后运行int? something2 = (A ?? B) ?? C;

完整代码在这里

这只是读取 A 而没有别的。

在我看来,这句话应该:

  1. 从括号开始,查看 A,返回 A,如果 A 不为 null,则结束。
  2. 如果 A 为空,则评估 B,如果 B 不为空,则结束
  3. 如果 A 和 B 为空,则评估 C。

因此,由于 A 不为空,它只查看 A 并完成。

在您的示例中,在第一种情况下放置断点表明 x、y 和 z 都不为空,因此,我希望它们与我不太复杂的示例一样被对待....但我担心我太多了一个 C# 新手,完全错过了这个问题的重点!

于 2011-06-06T20:34:45.573 回答