我有一个 html 文件,其中的链接格式为
<a href="http://www.google.com>Date: 25.02.2013 10:30 Name: Google</a><br>
我正在尝试编写一个 powershell 脚本,它将获取链接、日期、时间和名称,并将它们以 CSV 格式(链接、日期、时间、名称)
以下将为我提供链接,但不提供其余信息,我只是错过了什么吗?正则表达式有效,尽管在寻找名称的人中放弃“名称:”会有所帮助。
$input_path = 'C:\temp\myfile.html'
$output_file = 'C:\temp\myfile.csv'
$regex_link = '([a-zA-Z]{4})://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)’
$regex_date = '\d{2}\.\d{2}\.\d{4}'
$regex_time = '\d{2}:\d{2}'
$regex_name = 'Name:\s([\w]*)'
$myVar = select-string -Path $input_path -Pattern $regex_link, $regex_date, $regex_time, $regex_name -AllMatches| % { $_.Matches } | % { $_.Value }
$myVar