问题标签 [feedparser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1439 浏览

python - 带有雅虎天气RSS的python feedparser

我正在尝试使用 feedparser 从雅虎天气 rss 获取一些数据。看起来提要解析器剥离了 yweather 命名空间数据:

http://weather.yahooapis.com/forecastrss?w=24260013&u=c

看起来 feedparser 完全忽略了这一点。有没有得到它?

0 投票
1 回答
251 浏览

python - 是否有比 Feedparser 更新的 Python RSS 提要 API?

似乎有一段时间没有更新了,并且缺乏对 sy:updateFrequency 之类的支持。

0 投票
5 回答
1802 浏览

ruby-on-rails - 安装 FeedZirra 时出错

我是 Ruby on Rails 的新手。我对 Feed 解析感到兴奋,但是当我安装 FeedZirra 时,我收到了这个错误。

我使用 Windows 7 和 Ruby 1.8.7。

请帮忙。提前致谢。

0 投票
1 回答
855 浏览

python - feedparser - 各种错误

我需要一个项目的 feedparser (se http://www.feedparser.org ),并希望将第三方模块保存在一个单独的文件夹中。为此,我在我的 python 路径中添加了一个文件夹,并将相关模块放在那里,其中包括 feedparser。

第一次尝试导入 feedparser 导致

我在文件底部的注释中找到了文本“socket timeout; added...”,删除了这些注释,然后再次尝试:

好的,所以有些缩进错误。我确保有问题的函数中的缩进可以(将某些行分解为无缩进)。并再次尝试:

正如我谷歌一样,我找不到语法有任何问题:

怎么办?我的方法全错了吗?为什么我在一个看起来经过充分测试和信任的模块中不断产生这些错误?

0 投票
1 回答
698 浏览

python - 关于通用提要解析器的问题

我在从我抓取的几个博客提要中获取内容时遇到了问题。

I'm uncertain what is the reason, but by parsing one or two blogs with the feedparser returns me this particular error:

object has no attribute 'content'

or

object has no attribute 'link'

This hasn't been the case for the rest of my other blogs. Does empty entry content results in this?

0 投票
2 回答
2138 浏览

perl - 我可以使用什么模块来解析 Perl CGI 脚本中的 RSS 提要?

我试图找到一个可以与 Perl CGI 脚本一起使用的 RSS 解析器。我发现simplepie这真的很容易在 PHP 脚本中使用的解析器。不幸的是,这不适用于 Perl CGI 脚本。请让我知道是否有任何易于使用的东西,例如simplepie.

我遇到了这个RssDisplay但我不确定它的用法以及它有多好。

0 投票
2 回答
219 浏览

django - FeedJack 如何获取历史提要

我正在建立一个新闻聚合网站,并且正在寻找一种将(任何特定网站的)旧提要获取到系统中的方法。在这门课程中,我偶然发现了Feedjack。据说它可以处理我需要的东西。所以我开始深入研究源代码。(我不想直接在我的 django 项目中插入。)我所看到的是这一行:

我不确定这如何处理历史提要解析。我可以知道我错过了什么。我还有一个问题是,更不用说 feedjack,我如何访问任何网站的历史提要?

0 投票
1 回答
750 浏览

python - Python feedparser 不使用 atom/WordPress 命名空间?

我正在尝试使用feedparser(一个优秀的库)来解析 WordPress 导出文件,而 WordPress 版本之间的(轻微)不一致让我非常头疼。

atom:linkWordPress 2.x在 XML 输出 ( without_atom_tags.xml )中不包含标签。解析时,命名空间元素在没有前缀的情况下可用:

来自 WordPress 3.x 的 XML确实包含atom:link标签(with_atom_tags.xml),并且您必须为命名空间元素添加前缀:

xmlns:atom="http://www.w3.org/2005/Atom"有趣的是,如果我添加到根 RSS 元素(with_atom_tags_and_namespace.xml),则不需要前缀。

我需要在不修改 XML 的情况下解析所有这些不同的格式。feedparser 坏了,还是我做错了?我可以在没有一堆讨厌的条件代码的情况下做到这一点吗?

0 投票
3 回答
1677 浏览

python - 如何获得最终的重定向网址

我正在使用谷歌应用程序引擎来获取提要 url,但很少有 url 是 301 重定向我想获得最终的 url,它返回给我结果

我正在使用通用提要阅读器来解析 url 是否有任何方法或任何功能可以给我最终的 url。

0 投票
4 回答
2141 浏览

google-app-engine - 如何在 Google App Engine 上使用 urllib2 声明超时?

我知道它urllib2在 Google App Engine 上可用作 Urlfetch 的包装器,并且如您所知,Universal Feedparser 使用 urllib2。

您知道在 urllib2 上设置超时的任何方法吗?
urllib2 上的timeout参数是否已移植到 Google App Engine 版本上?

我对以下方法不感兴趣: