0

我正在使用 feedparser 打印前 5 个 Google 新闻标题。我以与往常相同的方式从 URL 获取所有信息。

x = 'https://news.google.com/news/feeds?pz=1&cf=all&ned=us&hl=en&topic=t&output=rss'
feed = fp.parse(x)

我的问题是当我启动一个 shell 时我正在运行这个脚本,所以大约 2 秒的延迟变得非常烦人。这个时间延迟主要来自通过网络的通信,还是来自解析文件?

如果它来自解析文件,有没有办法只取我需要的东西(因为在这种情况下这非常少)?

如果是前一种可能性,有没有办法加快这个过程?

4

2 回答 2

2

我想一些延迟加起来:

  • Python 解释器需要一段时间来启动和导入模块
  • 网络通信需要一点时间
  • 解析可能只消耗很少的时间,但确实如此

我认为没有直接的方法可以加快速度,尤其是第一点。我的建议是您定期下载您的提要(您可以设置一个 cron 作业或编写一个 Python 守护程序)并将其存储在磁盘上的某个位置(即纯文本文件),因此您只需在终端上显示它们启动(echo 可能是最简单和最快的)。

我个人对 feedparser 有很好的体验。我使用它通过 Python 守护程序每半小时下载约 100 个提要。

于 2013-06-20T20:10:36.753 回答
0

如果您想要更快的结果,则实时解析而不是更好的情况。

您可以尝试通过Celery或类似的其他解决方案异步执行此操作。我喜欢芹菜,它有很多能力。有诸如 cron 或 async 等任务的能力。

于 2013-06-20T20:22:37.153 回答