2

我的 Pinterest 提要将 RSS 标题截断为 20 个字符,我需要解析出“img src”和描述末尾的较长文本。

我非常简单的代码有效,但我不知道如何让我的新标题说“为什么你必须有一个#Elevator #Pitch - #marketing”

$feed = [xml](New-Object System.Net.WebClient).DownloadString('http://pinterest.com/bigoals365/feed.rss')

$feed.rss.channel.Item  | select title, link, description | Out-GridView

我也尝试过 Invoke-WebRequest,它适用于基本检索,但描述的解析让我很难过。

我的提要看起来像这样(RSS 的一行):

<item><title>Why You’ve Got to Ha</title><link>http://pinterest.com/pin/329888741425045427/</link> <description> &lt;p&gt;&lt;a href="http://pinterest.com/pin/329888741425045427/"&gt;&lt; img src="http://media-cache-lt0.pinterest.com/192x/bd/5e/7c/bd5e7cd628c21313d835a4e5c89d28ee.jpg"&gt;&lt;/a&gt;&lt;/p&gt;&lt;p&gt; Why You’ve Got to Have an #Elevator #Pitch - #marketing&lt;/p&gt; </description> <pubDate>Wed, 06 Mar 2013 21:59:55 +0000</pubDate><guid>http://pinterest.com/pin/329888741425045427/ </guid></item>

任何帮助将非常感激!

4

2 回答 2

1

也许这样?

$feed.rss.channel.item | %{ 
   if ($_.description -match '.*<img src="([^"]+)".*<p>(.*)</p>') { 
      $_.title = $matches[2];
      $_.link = $matches[1] 
   } 
   $_ 
} | select title, link, description | Out-GridView

希望这可以帮助

/弗雷德里克

于 2013-03-07T07:07:47.227 回答
0

我想这就是你要找的

$feed.rss.channel.Item | 
    select -Property link, description, @{
        n = 'title'
        e = {[regex]::Matches($_.description, '<p>(.+?)</p>')[1].Groups[1].Value}
     } | ogv

这使用带有 n(名称)和 e(表达式)键的哈希表创建自定义属性。

于 2013-03-07T07:05:16.307 回答