-1

我正在尝试使用 urllib 和美丽的汤进行解析。我可以获得标题、描述和链接,但我无法获得图像的 url。这就是我尝试的代码。视图.py

from django.conf import settings
from django.shortcuts import render
from django.http import HttpResponse
from django.utils.html import strip_tags
from os.path import basename, splitext
import os
import urllib
from bs4 import BeautifulSoup
def parser(request):
    source_txt=urllib.urlopen("http://timesofindia.feedsportal.com/c/33039/f/533928/index.rss")
    b=BeautifulSoup(source_txt.read())
    arr=[]
    for p in b.findAll('item'):
        d={}
        d['title']=p.title.string
        d['description']=strip_tags(p.description.string).strip(';&nbsp')
        d['guid']=p.guid.string
        for q in p.findAll('description'):
            for r in q.findAll('img'):
                d['img']=r['src']
        arr.append(d)
    return render(request,'temp.html',{'arr':arr})  

.html 文件:

<html>
<head>
</head>
<body>
{% for i in arr %}
 <p>{{i.title}}</p>
 <p>{{i.description}}</p>
 <p>{{i.guid}}</p>
 <img src="{{i.img}}" style="width:100px;height:100px;"><hr>
{% endfor %}
</body>
</html>

请帮助我进一步进行......

4

1 回答 1

0

RSS 不是什么新鲜事你知道吗?所以使用正确的工具代替 BeautifulSoup 锤子......

https://pypi.python.org/pypi/feedparser

于 2013-10-24T10:47:56.193 回答