3

上次我对PowerShell急切展开集合的方式感到困惑时,Keith 总结了它的启发式如下:

将结果(数组)放在分组表达式(或子表达式,例如 $())中使其再次符合展开的条件。

我已经把这个建议铭记在心,但仍然发现自己无法解释一些深奥的东西。特别是, Format 运算符似乎不遵守规则。

$lhs = "{0} {1}"

filter Identity { $_ }
filter Square { ($_, $_) }
filter Wrap { (,$_) }
filter SquareAndWrap { (,($_, $_)) }

$rhs = "a" | Square        
# 1. all succeed
$lhs -f $rhs
$lhs -f ($rhs)
$lhs -f $($rhs)
$lhs -f @($rhs)

$rhs = "a" | Square | Wrap       
# 2. all succeed
$lhs -f $rhs
$lhs -f ($rhs)
$lhs -f $($rhs)
$lhs -f @($rhs)

$rhs = "a" | SquareAndWrap       
# 3. all succeed
$lhs -f $rhs
$lhs -f ($rhs)
$lhs -f $($rhs)
$lhs -f @($rhs)

$rhs = "a", "b" | SquareAndWrap       
# 4. all succeed by coercing the inner array to the string "System.Object[]"
$lhs -f $rhs
$lhs -f ($rhs)
$lhs -f $($rhs)
$lhs -f @($rhs)

"a" | Square | % {
    # 5. all fail
    $lhs -f $_
    $lhs -f ($_)
    $lhs -f @($_)
    $lhs -f $($_)            
}

"a", "b" | Square | % {
    # 6. all fail
    $lhs -f $_
    $lhs -f ($_)
    $lhs -f @($_)
    $lhs -f $($_)            
}

"a" | Square | Wrap | % {
    # 7. all fail
    $lhs -f $_
    $lhs -f ($_)
    $lhs -f @($_)
    $lhs -f $($_)            
}

"a", "b" | Square | Wrap | % {
    # 8. all fail
    $lhs -f $_
    $lhs -f ($_)
    $lhs -f @($_)
    $lhs -f $($_)            
}

"a" | SquareAndWrap | % {
    # 9. only @() and $() succeed
    $lhs -f $_
    $lhs -f ($_)
    $lhs -f @($_)
    $lhs -f $($_)            
}

"a", "b" | SquareAndWrap | % {
    # 10. only $() succeeds
    $lhs -f $_
    $lhs -f ($_)
    $lhs -f @($_)
    $lhs -f $($_)            
}

应用我们在上一个问题中看到的相同模式,很明显为什么像 #1 和 #5 这样的情况表现不同:管道运算符向脚本引擎发出信号以展开另一个级别,而赋值运算符没有。换句话说,位于两个 | 之间的所有内容都被视为一个分组表达式,就好像它在 () 中一样。

# all of these output 2
("a" | Square).count                       # explicitly grouped
("a" | Square | measure).count             # grouped by pipes
("a" | Square | Identity).count            # pipe + ()
("a" | Square | Identity | measure).count  # pipe + pipe

出于同样的原因,案例#7 与#5 相比没有任何改进。任何添加额外Wrap的尝试都将立即被额外的管道破坏。同上 #8 与 #6。有点令人沮丧,但我完全同意这一点。

剩下的问题:

  • 为什么案例#3 没有遭受与#4 相同的命运? $rhs应该保存嵌套数组(,("a", "a"))但它的外层正在展开......某处......
  • #9-10 中的各种分组运算符是怎么回事?为什么他们的行为如此不规律,为什么需要他们?
  • 为什么 #10 的失败不会像 #4 那样优雅地降级?
4

2 回答 2

5

嗯,这肯定有一个错误。(我昨天刚刚在 PoshCode Wiki 上写了一个关于它的页面,实际上,在 connect 上有一个错误)。

先回答,后面有更多问题:

要从具有-f字符串格式的数组中获得一致的行为,您需要 100% 确保它们是 PSObject。我的建议是在分配它们时这样做。它应该由 PowerShell 自动完成,但由于某种原因,直到您访问属性或其他东西(如该wiki 页面bug中所述)才完成。例如(<##>是我的提示):

<##> $a = 1,2,3
<##> "$a"
1 2 3

<##> $OFS = "-"  # Set the Output field separator
<##> "$a"
1-2-3

<##> "{0}" -f $a
1 

<##> $a.Length
3 

<##> "{0}" -f $a
1-2-3

# You can enforce correct behavior by casting:
<##> [PSObject]$b = 1,2,3
<##> "{0}" -f $a
1-2-3

请注意,当您这样做时,它们在传递给 -f 时不会展开,而是会正确输出——就像您将变量直接放在字符串中时一样。

为什么案例#3 没有遭受与#4 相同的命运?$rhs 应该保存嵌套数组 (,("a", "a")) 但它的外层正在展开......某处......

答案的简单版本是 #3 和 #4 都在展开。不同的是,在 4 中,内部内容是一个数组(即使在展开外部数组之后):

$rhs = "a" | SquareAndWrap
$rhs[0].GetType()  # String

$rhs = "a","b" | SquareAndWrap
$rhs[0].GetType()  # Object[]

#9-10 中的各种分组运算符是怎么回事?为什么他们的行为如此不规律,为什么需要他们?

正如我之前所说,数组应该算作格式的单个参数,并且应该使用 PowerShell 的字符串格式规则(即:用 分隔$OFS)输出,就像将 $_ 直接放入字符串中一样......因此,当 PowerShell 行为正确时,$lhs -f $rhs如果 $lhs 包含两个占位符,则会失败。

当然,我们已经观察到其中有一个错误。

但是,我没有看到任何不稳定的情况:据我所知,@() 和 $() 对于 9 和 10 的工作方式相同(实际上,主要区别是由 ForEach 展开顶级数组的方式引起的:

> $rhs = "a", "b" | SquareAndWrap
> $rhs | % { $lhs -f @($_); " hi " }
a a
 hi 
b b
 hi 

> $rhs | % { $lhs -f $($_); " hi " }
a a
 hi 
b b
 hi     

# Is the same as:
> [String]::Format( "{0} {1}", $rhs[0] ); " hi "
a a
 hi 

> [String]::Format( "{0} {1}", $rhs[1] ); " hi "
b b
 hi     

所以你看到的错误是@() 或 $() 将导致数组作为 [object[]] 传递给字符串格式调用,而不是作为具有特殊 to-string 值的 PSObject。

为什么 #10 的失败不会像 #4 那样优雅地降级?

这基本上是相同的错误,但表现形式不同。数组不应该在 PowerShell 中以“System.Object[]”的形式出现,除非您手动调用它们的本机.ToString()方法,或者直接将它们传递给 String.Format() ......他们在 #4 中这样做的原因是 bug:PowerShell 失败了在将它们传递给 String.Format 调用之前将它们扩展为 PSOjbect。

如果您在传入数组之前访问该数组的属性,或者将其转换为 PSObject,就像在我的原始示例中一样,您可以看到这一点。从技术上讲,#10 中的错误是正确的输出:您只将一个东西(一个数组)传递给 string.format,而它需要两个东西。如果您将 $lhs 更改为“{0}”,您会看到使用 $OFS 格式化的数组


不过,我想知道,考虑到我的第一个例子,你喜欢哪种行为,你认为哪种行为是正确的?我认为 $OFS 分隔的输出是正确的,而不是像 @(wrap) 它那样展开数组,或者将其转换为 [object[]] (顺便提一下,如果将它转换为 [int[ ]] 是一种不同的错误行为):

> "{0}" -f [object[]]$a
1

> "{0}, {1}" -f [object[]]$a  # just to be clear...
1,2

>  "{0}, {1}" -f [object[]]$a, "two"  # to demonstrate inconsistency
System.Object[],two

> "{0}" -f [int[]]$a
System.Int32[]

我敢肯定很多脚本是在不知不觉中利用这个错误编写的,但我仍然很清楚,在这个只是为了清楚的例子中发生的展开并不是正确的行为,而是因为在对 .Net 的调用(在 PowerShell 的核心内部)String.Format( "{0}", a )......这$aobject[]String.Format 所期望的,因为它是 Params 参数......

我认为必须解决这个问题。如果想要保持展开数组的“功能”,应该使用@splatting 操作符来完成,对吧?

于 2009-12-09T20:46:22.497 回答
2

Square 和 Wrap 都不会执行您在 # 的 5 和 7 中尝试的操作。无论您是像在 Square 中那样将数组放在分组表达式 () 中,还是像在 Wrap 中那样使用逗号运算符,当您在管道中使用这些函数,它们的输出被展开,因为它一次馈送到下一个管道阶段。类似地,在 6 和 8 中,管道输入多个对象并不重要,Square 和 Wrap 都会一次将它们送出到您的 foreach 阶段。

案例 9 和 10 似乎表明 PowerShell 中存在错误。拿这个修改后的代码片段试试看:

"a" | SquareAndWrap | % {    
    # 9. only @() and $() succeed  
    $_.GetType().FullName
    $_.Length
    $lhs -f [object[]]$_
    $lhs -f [object[]]($_)    
    $lhs -f @($_)   
    $lhs -f $($_)            
}

有用。它还表明 foreach 已经接收到一个大小为 2 的 object[],因此$_应该可以在不强制转换为 [object[]] 或包装在子表达式或数组子表达式中的情况下工作。我们已经看到一些与 psobjects 相关的 V2 错误没有正确展开,这似乎是另一个例子。如果您手动解开 psobject,它可以工作,例如$_.psobject.baseobject.

我“认为”您在 Wrap 中的目标是:

function Wrap2 { Begin {$coll = @();} Process {$coll += $_} End {,$coll} }

这将累积所有管道输入,然后将其作为单个数组输出。这适用于案例 8,但您仍然需要在-f运算符的前两次使用中强制转换为 [object[]]。

顺便说一句, Square 和 Wrap 中的括号以及 SquareAndWrap 中的外部括号都是不必要的。

于 2009-12-09T16:32:47.960 回答