4

我正在尝试编写一个 Powershell 脚本,该脚本将在 HTML 文件中的两个 HTML 标记之间提取一个字符串。我不知道值是什么,但我知道需要搜索哪些标签。此外,我知道标签并不总是出现在一行的开头(即,它们可以在一行文本的中间)。最后,我也知道标签和它们之间的字符串永远不会跨越一条线。

我将文件的路径存储在变量中

$filePath = "C:\Path\file.html"

我试图找到和之间的任何值<h6>并将</h6>这些值存储在一个数组中。

4

1 回答 1

2

尝试

$myarray = gc $filepath | 
% { [regex]::matches( $_ , '(?<=<h6>\s+)(.*?)(?=\s+</h6>)' ) } | 
select -expa value

如果有的话,这会删除起始和尾随空格。如果您还需要此空格\s+,请从正则表达式模式中删除

于 2013-02-14T13:21:40.110 回答