从网站上抓取正确的照片:我正在制作一个简单的新闻应用程序。我有这篇文章,但我需要选择正确的照片。
例如,在:
http://www.politico.com/story/2013/09/government-shutdown-2013-gop-narrative-97521.html
我想抓取 3 个人照片的 url。但是有几个图像要刮。我怎么知道哪张是正确的照片。news.google 和flipboard 做什么逻辑从文章或任何文章中刮取“正确”的照片。
我注意到大多数时候这些照片都在幻灯片中。我如何使用 Beautiful Soup 来抓取这些幻灯片的照片。