0

在此先感谢您的时间。

我是 PowerShell 的新手,试图编写一个脚本,它可以搜索一堆文本文件并挑选出某些元素,然后用这些来替换其他元素。以下是内容示例:

OrderLine="0002" <Image>11770060002_outside.jpg</Image><Image>11770060002_inside.jpg</Image>
OrderLine="0003" <Image>11770060003_outside.jpg</Image><Image>11770060003_inside.jpg</Image>

所以我想要做的是逐步完成,选择“OrderLine”值并将其放入变量中,然后替换“Image”值 - 仅显示预期输出可能比尝试解释它更容易!

OrderLine="0002" <Image>11770060002.pdf</Image>
OrderLine="0003" <Image>11770060003.pdf</Image>

如您所见,文件名已被替换,并且名称的结尾与 OrderLine 相同。文件中可能只有一个订单行,或者可能有 150 个订单行,但规则始终相同。

我知道它看起来像 XML,但它是无效的(不要问)所以它不会像这样解析,需要是基于文本的解决方案。

任何帮助感激不尽!

编辑:这是我到目前为止所拥有的,这可行,但它从文件名中获取值(与文件中的第一个条目相同,即 0001),因此它仅适用于具有单个订单的文件。我需要更新例程以处理上述多个 OrderLine 条目。

$File_Folder = "C:\PSTEST\TEST\"
$Output_Folder = "C:\PSTEST\TEST\OUTPUT\"

$array = Get-ChildItem $File_Folder\*.xml

foreach($item in $array){

$xml_filename = $item.FullName.substring($File_Folder.Length)

$just_filename = $xml_filename -replace ".xml", ""
$just_filename = $just_filename -replace "Order_PO", ""

$replace_outside_original = '<image>' + $just_filename + '_outside.jpg</Image>'
$replace_outside_with = '<image>' + $just_filename + '.pdf</image>'

$replace_inside_original = '<image>' + $just_filename + '_inside.jpg</Image>'
$replace_inside_with = ''

$destination_file = $Output_Folder + 'Order_PO' + $just_filename + '.xml'

(Get-Content $File_Folder\$xml_filename) | Foreach-Object {
    $_ -replace $replace_outside_original, $replace_outside_with `
       -replace $replace_inside_original, $replace_inside_with `
    } | Set-Content $destination_file
}
4

2 回答 2

0

成功!没有 mjolinor 的帮助,我无法做到这一点,非常感谢您花时间帮助我,我真的很感激。

最后,我通过替换一个然后运行并执行另一个来实现它,我认为这是输出真/假的匹配语句,我没有解决它的技能。这种方式不是最干净的,但它完成了工作:

$File_Folder = "C:\PSTEST\TEST\"
$regex  = '<Image>\d+_inside.jpg</Image>'
$array = Get-ChildItem $File_Folder\*.xml | ForEach-Object { (Get-Content $_) -replace '_outside\.jpg','.pdf' | Set-Content -path $_ }
$array = Get-ChildItem $File_Folder\*.xml | ForEach-Object { (Get-Content $_) -replace $regex,'' | Set-Content -path $_ }
于 2013-04-04T09:15:08.253 回答
0

使用正则表达式:

从您需要匹配的行之一开始:

OrderLine="0002" 11770060002_outside.jpg11770060002_inside.jpg

用正则表达式元字符替换可变部分。在这种情况下,变量数据是数字:

$regex  = 'OrderLine="\d+" <Image>\d+_outside.jpg</Image><Image>\d+_inside.jpg</Image>'

然后为要保留的部分添加分组括号:

$regex  = '(OrderLine="\d+" <Image>\d+_outside.jpg</Image>)<Image>\d+_inside.jpg</Image>'

然后使用 -match 过滤掉与正则表达式匹配的行,使用 -replace 与对捕获组的反向引用进行修剪,并使用另一个 replace 替换文本的文字部分,然后将结果输出到另一个文件。

(get-content file.txt) -match $regex -replace $regex,'$1' -replace '_outside\.jpg','.pdf' |
 set-content newfile.txt
于 2013-04-03T12:28:16.147 回答