问题标签 [feedparser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
objective-c - NSDateFormatter 与 RSS pubDate
我在将 rss pubdate 字符串转换为 NSDate 对象时遇到了一些问题。
我总是得到
android - 在原子解析的帮助下解析
我必须解析这种类型的xml ..
我如何通过原子解析(根处理程序,元素处理程序)来解析它。
python - 使用 feedparser 检索项目的原始 XML
我正在尝试使用 feedparser 从提要中检索一些特定信息,但也检索每个条目的原始 XML(即 RSS 和 Atom 的元素),但我不知道该怎么做。显然我可以手动解析 XML,但这不是很优雅,需要单独支持 RSS 和 Atom,我想它可能会与 feedparser 不同步以获取格式错误的提要。有没有更好的办法?
谢谢!
rss - 我在哪里可以找到 feedparser 文档?
feedparser 文档曾经在http://feedparser.org/上可用,但现在 URL 显示找不到资源并且没有转发地址。
任何人都知道文档已移动到哪里或我在哪里可以找到文档?
此外,使用 feedparser 如何检索标签的属性。例如,如果一个提要有一个
如何检索名字和姓氏?
simplexml - 使用 SimpleXML 解析 RSS 提要
当我运行此代码时:
它产生以下错误:
我的共享主机使用 PHP5.2.17 运行
请提供解决方案。
提前致谢。
python - Feedparser(和 urllib2)问题:连接超时
从 Python 中的urllib2
和feedparser
库开始,每当尝试从特定 URL 连接和获取内容时,我大部分时间都会收到以下错误:
最小的可重现示例(基本、feedparser.parser
直接使用和高级,我urllib2
首先使用库来获取 XML 内容)粘贴在下面。
当我尝试使用不同的 URL 地址(例如http://www.delo.si/rss/
)时,一切正常。请注意,所有 URL 都指向非英语(即斯洛文尼亚语)RSS 提要。
我从本地和远程机器(通过ssh
)运行我的实验。报告的错误在远程机器上发生得更频繁,尽管即使在本地主机上也是不可预测的。
任何建议将不胜感激。
xml - XML::RSS::Parser 和 Facebook RSS 提要...
我需要一个子程序来解析传递给它的“任何”RSS 提要。我已经多次使用 XML::RSS:Parser 来处理一些 RSS 提要,但它不适用于 Facebook。
示例代码:
有线 Facebook 提要的结果
我认为 XML::RSS::Parsers 没有从根元素获得正确的命名空间,之后没有任何效果。想法如何解决这个问题?
我可以使用 XML::Simple 或类似的东西来解析 Facebook 的 RSS,但我想要一个解析器来处理所有 rss 提要。
我将破解 XML/RSS/Parser.pm 以找到原因,但这不是仅为 facebook 更改包的解决方案。这个 facebook 提要在 ie android rss reader 中运行良好。
python - 使用 feedparser 检查 RSS 提要的新内容
我正在使用 python 构建一个应用程序,其功能类似于 RSS 聚合器。我正在使用 feedparser 库来执行此操作。但是,我正在努力让程序正确检测是否有新内容。
我主要关注与新闻相关的提要。除了查看是否已将新项目添加到提要中之外,我还希望能够检测以前的文章是否已更新。有谁知道我如何使用 feedparser 来做到这一点,记住唯一的强制性项目元素是标题或描述?我愿意假设链接元素也将始终存在。
Feedparser 与每个项目关联的“id”属性似乎只是指向文章的链接,因此这可能有助于检测提要上的新文章,但不能检测对以前文章的更新,因为这些文章的“id”不会改变。
我查看了 stackoverflow 上的先前线程,有些人建议散列内容或散列标题 + url,但我不确定这意味着什么或如何去做(如果确实是正确的方法)。
ruby - 为什么 Ruby -rdebug 和 IRB 对同一个程序给出不同的结果?
运行完全相同的需要 feedparser lib 的 Ruby 程序。它在 IRB 中运行正常,但是当我使用ruby -rdebug
. 我在这两种方法中仔细检查了 lib 搜索路径,它们与以下相同。
python - Python Feedparser 在解析的输出中缺少一个名为“name”的条目
我有一个filename.xml
包含内容的 XML 文件
我正在使用 Python Universal Feed Parser 模块来解析它,如下所示:
生成的解析输出(如下)缺少该name
条目,但其他所有内容都在那里。
我究竟做错了什么?