1

我有这个脚本可以对文件进行一些正则表达式替换。我不明白为什么返回的字符串都删除了所有换行符?

示例文件内容(UTF-8,每行后带有 CR-LF):

hello
hello
hello

剧本:

$content = Get-Content "c:\spikes\regexnewline\regexnewline.txt"
Set-Content "c:\spikes\regexnewline\regexnewline-2.txt" $content # test

$content = [regex]::Replace($content, "ll", "yy") #basic replace

Set-Content "c:\spikes\regexnewline\regexnewline-3.txt" $content

当然,fileregexnewline-2.txt是输入文件的精确副本。但是为什么regexnewline-3.txt它的内容只有一行,最后有一个 CR-LF?

heyyo heyyo heyyo\CR\LF

显然我在这里遗漏了一些东西。谁能发现它?

顺便说一句,我尝试使用 regex.Replace 并使用带有 4 个参数的重载,指定RegexOptions如 MSDN 上所述,但脚本失败,说明此方法没有 4 参数重载。Powershell 是否使用不同版本的 .Net 框架?

4

1 回答 1

8

您看到此内容的原因是,当您最初从文件中读取时,$content 是一个字符串数组。您可以看到任何变量的类型,如下所示:

$content.GetType().FullName

Get-Content 默认返回一个字符串数组,其中每个元素代表一行。当您将该数组传递给 .NET 的正则表达式替换方法时,PowerShell 看不到采用字符串数组的方法重载,但确实看到采用字符串的方法重载,因此它将您的字符串数组强制转换为字符串。如果您在 Get-Content 调用之后立即执行此操作,则可以看到相同的效果:

"$content"

您甚至可以修改 PowerShell 在执行此操作时连接各个元素的方式:

$OFS = ", "
"$content"

与其使用 .NET 正则表达式替换,不如尝试使用-replace也处理正则表达式的 PowerShell 运算符:

$content = $content -replace 'll','yy'
于 2013-10-09T15:35:23.423 回答