我在 PowerShell 中编写了一些屏幕抓取代码,并惊讶地发现解析几个 HTML 表格需要大约 30 秒。我把它剥离出来,试图找出所有时间都花在了哪里,它似乎在getElementsByTagName
通话中。
我在下面包含了一个脚本,在我的家庭桌面、工作桌面和家庭平板上,每次迭代大约需要 1-2 秒(完整结果粘贴在下面)。但是,PowerShell 社区中的其他人报告的时间要短得多(每次迭代只有几毫秒)。
我正在努力寻找缩小问题范围的任何方法,而且 OS/PS/.NET/IE 版本似乎没有模式。
我目前正在运行它的桌面是全新的 Windows 8 安装,仅安装了 PS3 和 .NET 4.5(以及所有 Windows 更新补丁)。没有 Visual Studio。没有 PowerShell 配置文件。
$url = "http://www.icy-veins.com/restoration-shaman-wow-pve-healing-gear-loot-best-in-slot"
$response = (iwr $url).ParsedHtml
# Loop through the h2 tags
$response.body.getElementsByTagName("h2") | foreach {
# Get the table that comes after the heading
$slotTable = $_.nextSibling
# Grab the rows from the table, skipping the first row (column headers)
measure-command { $rows = $slotTable.getElementsByTagName("tr") | select -Skip 1 } | select TotalMilliseconds
}
来自我的桌面的结果(工作 PC 和 slate 给出几乎相同的结果):
TotalMilliseconds
-----------------
1575.7633
2371.5566
1073.7552
2307.8844
1779.5518
1063.9977
1588.5112
1372.4927
1248.7245
1718.3555
3283.843
2931.1616
2557.8595
1230.5093
995.2934
但是,Google+ PowerShell 社区中的一些人报告了这样的结果:
TotalMilliseconds
-----------------
76.9098
112.6745
56.6522
140.5845
84.9599
48.6669
79.9283
73.4511
94.0683
81.4443
147.809
139.2805
111.4078
56.3881
41.3386
我已经尝试过 PowerShell ISE 和标准控制台,没有区别。对于正在做的工作,这些时间似乎有点过时,从Google+ 社区的帖子来看,它可以走得更快!