我尝试使用提要解析器读取 RSS 提要。
import feedparser
url = 'http://example.com/news.xml'
d=feedparser.parse(url)
f = open('rss.dat','w')
for e in d.entries:
title = e.title
print >>f, address
f.close()
它适用于英文 RSS 提要,但如果我尝试显示用西里尔字母书写的标题,则会收到 UnicodeEncodeError。它发生在我:
- 尝试将标题写入文件。
- 尝试在屏幕上显示标题。
- 尝试在 URL 中使用它来访问网页。
我的问题是如何轻松解决这个问题。我很想有一个像这样简单的解决方案:
new_title = some_function(title)
可能有办法用 HTML 代码替换每个西里尔符号吗?