0

我有两个问题:)

  1. 我正在为我的 irc 机器人进行扩展。它应该检查 rss 的新内容并将其发布到频道。我正在使用 feedparser。我发现的唯一方法是将每个新内容存储到文件中,每隔几分钟下载 rss 内容并将其与文件中的内容匹配,这在我看来有点奇怪。是否有一些简单的方法可以检查 rss 中是否有新内容?谢谢

  2. 当我将内容保存到文件时,有时某些部分由 unicode(捷克语中的特殊字符)编码 - u“xxx”。但我想将它们保存为 utf8 文件。我该怎么做?

4

1 回答 1

2
  1. RSS 项目通常具有与其关联的 GUID 或链接。如果存在则使用 GUID,否则使用链接来唯一标识每个项目。您仍然需要跟踪您以前看过哪些,因为 RSS 格式不会告诉您自上次以来发生了什么变化。恐怕真的没有别的办法了。

  2. 要以 UTF-8 保存data(unicode 对象),只需在写入文件时对其进行编码:

    output.write(data.encode('utf8'))
    

请阅读 Joel Spolsky关于 UnicodePython Unicode HOWTO的文章,以充分了解编码和解码的含义。

于 2012-09-11T13:37:21.153 回答