2

http://bit.ly/4z5IFj

此 rss 提要不包含帖子图像,可能是因为该站点对图像的排列不正确。图像出现在标题上方,图像也没有完整(如在 css 中)

示例帖子:http ://bit.ly/LEj3tj

<div id="newsItemComplete">
<p><img src="news_images/712315777drugs1.jpg" alt="Over 19,000 suspects ...." /></p>

<h2 class="completeNewsTitle" style="margin-top:10px;">Over 19,000 suspects ....</h2>   

<p class="newsDateStamp"  style="width:100%; float:left; margin:0;">June 14, 2012&nbsp;&nbsp;05:04 pm</p>
</div>

<div class="newsContent"  style="width:100%; float:left; clear:both; margin-bottom:5px;"> 

<p>The police have seized ....</p>         
</div> 
</div>
<div class="clearFix"></div>

<!-- control:news headline item ends here --><!-- control:category list starts here -->
<!-- control:category list ends here -->
<!-- headline news article  -->

我想得到与描述相对应的完整文章并获取图像,有人可以帮忙吗?

4

2 回答 2

1

干得好,但它并不完全正确。

当您将管道输出放入网页时,不会显示任何图像,因为链接是对于原始网站而不是您的。您可以使用正则表达式模块插入缺少的 URL 的其余部分并使链接成为绝对链接,但原始网站会对您热链接到他们的图像不满意。

雅虎管道无法仅获取指向它们的链接的图像。让您的网站获取这些图像的副本有点复杂,最好使用 PHP 从您的网站服务器上进行所有抓取。

其他需要注意的Fetch Page Module 可能会在六个月或更短的时间内消失,因此您现在真的需要开始使用XPATH Fetch Page Module。

这是一个不完整的管道,可根据您的要求帮助您入门。 http://pipes.yahoo.com/pipes/pipe.info?_id=d7aba8c124693f3af888838ca12ac547

顺便说一句,不要忘记将您自己的 ID 代码换成广告和“喜欢”按钮,或者使用正则表达式模块将它们完全删除

于 2012-06-14T21:44:28.890 回答
0

我自己修好了,这里是截图。它获取链接并获取我想要的部分并将其复制到描述中。

http://i.stack.imgur.com/CZ1lx.png

于 2012-06-14T18:10:14.860 回答