我有两个问题:)
我正在为我的 irc 机器人进行扩展。它应该检查 rss 的新内容并将其发布到频道。我正在使用 feedparser。我发现的唯一方法是将每个新内容存储到文件中,每隔几分钟下载 rss 内容并将其与文件中的内容匹配,这在我看来有点奇怪。是否有一些简单的方法可以检查 rss 中是否有新内容?谢谢
当我将内容保存到文件时,有时某些部分由 unicode(捷克语中的特殊字符)编码 - u“xxx”。但我想将它们保存为 utf8 文件。我该怎么做?
RSS 项目通常具有与其关联的 GUID 或链接。如果存在则使用 GUID,否则使用链接来唯一标识每个项目。您仍然需要跟踪您以前看过哪些,因为 RSS 格式不会告诉您自上次以来发生了什么变化。恐怕真的没有别的办法了。
要以 UTF-8 保存data
(unicode 对象),只需在写入文件时对其进行编码:
output.write(data.encode('utf8'))
请阅读 Joel Spolsky关于 Unicode和Python Unicode HOWTO的文章,以充分了解编码和解码的含义。