我有以下 powershell 脚本来获取 RSS 结果。但是,该脚本返回的是格式化的 RSS 内容的 HTML 代码,而不是原始的 RSS 源,可以通过右键单击 IE 屏幕和“查看源”来查看。
问题:
如何获取原始 RSS(XML) 源?
$url = "http://www.osnews.com/files/recent.xml"
$ie = New-Object -com "InternetExplorer.Application"
$ie.Navigate($url)
while ($ie.busy) { start-sleep -milliseconds 1000; }
$ie.Document.documentElement.OuterHTML
更新:
我没有使用 webclient,因为我需要先登录我的网站(这里我只是使用 osnews.com 作为示例)。使用 webclient 使用 powershell(cookie、凭据等)登录我的网站似乎并不容易。
我原来的例子:
$ie$url = New-Object -com "InternetExplorer.Application"
$ie.Navigate("http://mysite.com/login")
$ie.visible = $true
while ($ie.busy) { start-sleep -milliseconds 1000; }
$ie.Document.getElementById("username").value = "myusername";
$ie.Document.getElementById("password").value = "mypassword";
$ie.Document.getElementById("login").click();
while ($ie.busy) { start-sleep -milliseconds 1000; }
$url = "http://mysite.com/rss/..."
$ie.Navigate($url)}
[xml]$rss = $ie.Document.documentElement.OuterHTML