问题标签 [feedparser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
2652 浏览

objective-c - NSDateFormatter 与 RSS pubDate

我在将 rss pubdate 字符串转换为 NSDate 对象时遇到了一些问题。

我总是得到

0 投票
1 回答
427 浏览

android - 在原子解析的帮助下解析

我必须解析这种类型的xml ..

我如何通过原子解析(根处理程序,元素处理程序)来解析它。

0 投票
1 回答
1102 浏览

python - 使用 feedparser 检索项目的原始 XML

我正在尝试使用 feedparser 从提要中检索一些特定信息,但也检索每个条目的原始 XML(即 RSS 和 Atom 的元素),但我不知道该怎么做。显然我可以手动解析 XML,但这不是很优雅,需要单独支持 RSS 和 Atom,我想它可能会与 feedparser 不同步以获取格式错误的提要。有没有更好的办法?

谢谢!

0 投票
2 回答
357 浏览

rss - 我在哪里可以找到 feedparser 文档?

feedparser 文档曾经在http://feedparser.org/上可用,但现在 URL 显示找不到资源并且没有转发地址。

任何人都知道文档已移动到哪里或我在哪里可以找到文档?

此外,使用 feedparser 如何检索标签的属性。例如,如果一个提要有一个

如何检索名字和姓氏?

0 投票
1 回答
3655 浏览

simplexml - 使用 SimpleXML 解析 RSS 提要

当我运行此代码时:

它产生以下错误:

我的共享主机使用 PHP5.2.17 运行

请提供解决方案。

提前致谢。

0 投票
2 回答
2018 浏览

python - Feedparser(和 urllib2)问题:连接超时

从 Python 中的urllib2feedparser库开始,每当尝试从特定 URL 连接和获取内容时,我大部分时间都会收到以下错误:

最小的可重现示例(基本、feedparser.parser直接使用和高级,我urllib2首先使用库来获取 XML 内容)粘贴在下面。

当我尝试使用不同的 URL 地址(例如http://www.delo.si/rss/)时,一切正常。请注意,所有 URL 都指向非英语(即斯洛文尼亚语)RSS 提要。

我从本地和远程机器(通过ssh)运行我的实验。报告的错误在远程机器上发生得更频繁,尽管即使在本地主机上也是不可预测的。

任何建议将不胜感激。

0 投票
1 回答
1187 浏览

xml - XML::RSS::Parser 和 Facebook RSS 提要...

我需要一个子程序来解析传递给它的“任何”RSS 提要。我已经多次使用 XML::RSS:Parser 来处理一些 RSS 提要,但它不适用于 Facebook。

示例代码:

有线 Facebook 提要的结果

我认为 XML::RSS::Parsers 没有从根元素获得正确的命名空间,之后没有任何效果。想法如何解决这个问题?

我可以使用 XML::Simple 或类似的东西来解析 Facebook 的 RSS,但我想要一个解析器来处理所有 rss 提要。

我将破解 XML/RSS/Parser.pm 以找到原因,但这不是仅为 facebook 更改包的解决方案。这个 facebook 提要在 ie android rss reader 中运行良好。

0 投票
1 回答
2878 浏览

python - 使用 feedparser 检查 RSS 提要的新内容

我正在使用 python 构建一个应用程序,其功能类似于 RSS 聚合器。我正在使用 feedparser 库来执行此操作。但是,我正在努力让程序正确检测是否有新内容。

我主要关注与新闻相关的提要。除了查看是否已将新项目添加到提要中之外,我还希望能够检测以前的文章是否已更新。有谁知道我如何使用 feedparser 来做到这一点,记住唯一的强制性项目元素是标题或描述?我愿意假设链接元素也将始终存在。

Feedparser 与每个项目关联的“id”属性似乎只是指向文章的链接,因此这可能有助于检测提要上的新文章,但不能检测对以前文章的更新,因为这些文章的“id”不会改变。

我查看了 stackoverflow 上的先前线程,有些人建议散列内容或散列标题 + url,但我不确定这意味着什么或如何去做(如果确实是正确的方法)。

0 投票
0 回答
109 浏览

ruby - 为什么 Ruby -rdebug 和 IRB 对同一个程序给出不同的结果?

运行完全相同的需要 feedparser lib 的 Ruby 程序。它在 IRB 中运行正常,但是当我使用ruby -rdebug. 我在这两种方法中仔细检查了 lib 搜索路径,它们与以下相同。

0 投票
1 回答
324 浏览

python - Python Feedparser 在解析的输出中缺少一个名为“name”的条目

我有一个filename.xml包含内容的 XML 文件

我正在使用 Python Universal Feed Parser 模块来解析它,如下所示:

生成的解析输出(如下)缺少该name条目,但其他所有内容都在那里。

我究竟做错了什么?