问题标签 [feedparser]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

347 问题

0 投票

2 回答

2390 浏览

python - Python 和 FeedParser 问题

我是 Python 新手。我有使用 Feedparser 的代码：

我的问题。

如何将 10 个条目添加到变量“更新”？

最好的祝福，

python feedparser

2011-03-29T17:05:28.080

0 投票

3 回答

2340 浏览

python - Python CouchDB 无法保存从 feedparser 条目创建的字典？（没有属性“读取”）

我有一个脚本，我想读取 RSS 提要中的条目并将单个条目以 JSON 格式存储到 CouchDB 数据库中。

我的代码中有趣的部分如下所示：

当我尝试运行该代码时，我收到以下错误db.save(item)：

好的，所以我然后做了一些调试......

结果<class 'feedparser.FeedParserDict'>- 啊，所以 feedparser 正在使用它自己的 dict 类型......好吧，如果我尝试将它显式转换为 adict呢？

w-什么？这没有意义，因为以下工作正常并且类型仍然是dict：

我在这里想念什么？

2011-03-31T20:04:04.623

0 投票

2 回答

344 浏览

xml - 解析大型 XML 提要时处理重复数据

我正在编写一个组件，它解析带有股票报价的 xml 提要并将结果保存在数据库中。问题相当简单，只是无法增量读取提要。也就是说，没有办法指定您只希望 X 最后报价更改或仅更改比 X 分钟更新，例如。我知道真正的问题是提要很愚蠢，提供商应该修复他们的东西，但这不是 atm 的选择。

提要是一个巨大的 xml 文件，其中包含供应商的 100000 条最新股票报价。提要每分钟轮询一次，在此期间大约有 50-100 个更改的报价。其余的是重复的引号，一遍又一遍地阅读。

在每次提要轮询期间，我将所有引号（使用 lxml）解析为对象。然后，对于每个报价对象，我检查数据库中是否已经存在报价。如果是，我丢弃它，如果不是，我保存它。这个过程非常浪费，因为只有大约 0.1% 是新数据，其余的都是重复的。为了稍微优化一下，我通过在数据库中查询一次最近 X 小时内更新的报价来创建一个查找表。引号在 (last_update, stock_id) 键上的数据库中是唯一的，因此此优化将查询数量减少了约 50%。

但是仍然有 50k 数据库查询，其中每个报价必须单独检查是否存在，这对数据库来说非常繁重。

所以我正在寻找关于如何使我的提要解析器更快的想法。也许有一种方法可以将最后获取的 xml 文件与新文件进行比较？

xml feed polling feedparser stockquotes

2011-04-01T08:28:29.727

0 投票

4 回答

1694 浏览

javascript - 测试未声明的变量

我正在尝试使用 javascript 解析 RSS 提要。有时一个提要有多个类别，所以我想检查第 2 项是否有任何内容。如果我不检查，我会收到错误消息，当我使用以下代码检查时，我也会收到错误消息。（我只是将 var cat2 设置为测试变量是否已定义）。

javascript variables undefined feedparser

2011-04-04T16:05:52.337

0 投票

1 回答

738 浏览

iphone - 标签内的 MWFeedParser 标签（媒体：缩略图）

我正在使用 MWFeedParser 从这里读取 Youtube atom 提要：这里

xml代码：

我如何获得媒体的网址：缩略图？我试图从这个改变 MWFeedParser.m：

对此：

但它不起作用:(

iphone xml rss youtube feedparser

2011-04-11T02:47:21.430

0 投票

1 回答

500 浏览

java - 帮助正则表达式解析并获取
html中的标签

我有一个要从中获取数据的站点，其内容布局如下：

我正在使用 Java 来获取网页的内容，并尝试像这样解析它：

但是随后抛出一个异常，说没有找到匹配项......

我的正则表达式正确吗？还有什么可能发生的？我的 html 没问题，但显然我的正则表达式不匹配......

谢谢

java html regex feedparser

2011-04-14T19:52:26.597

0 投票

2 回答

3284 浏览

python - 也处理 FeedBurner 的 Python RSS 解析器

我正在为 RSS 提要编写 Python 解析器脚本。我正在使用 feedparser，但是，我一直在解析来自 FeedBurner 的提要。现在谁需要 FeedBurner？无论如何..

例如，我找不到解析的方法

http://feeds.wired.com/wired/index

http://feeds2.feedburner.com/ziffdavis/pcmag

当我将它们放入 feedparser 库时，似乎不起作用。尝试将 ?fmt=xml 或 ?format=xml 放在 url 的末尾，但仍然没有得到 xml 格式。

我是否需要使用诸如 BeautifulSoup 之类的 html 解析器来解析 FeedBurner 提要？最好是已经有一个 python 公共解析器或聚合器脚本来处理这个问题吗？

任何提示或帮助将不胜感激。

python rss feed xml-parsing feedparser

2011-04-19T21:31:37.600

0 投票

1 回答

1147 浏览

python - 将 FeedParser 对象序列化为 Atom

我使用 feedparser http://www.feedparser.org/来解析 Atom 提要，并对生成的 Python 对象进行一些操作。之后，我想将对象序列化回 Atom。但是 feedparser 似乎没有提供这样做的方法？

我注意到其他 Atom 库，如 gdata http://code.google.com/p/gdata-python-client/或 demokritos http://jtauber.com/demokritos/但是，说实话，他们似乎很难初学者。我使用 feedparser 正是因为它极其简单。

根据 namsral 的良好响应，我用我最喜欢的模板语言 SimpleTAL 编写了一个序列化程序

python feedparser atom-feed

2011-05-06T19:54:17.967

0 投票

2 回答

2338 浏览

python - 如何在 python 中修改 atom/rss 提要？

这是我想在 python 中做的事情：

吃点东西
将数据添加到提要
重新发布如此修改的提要

Feedparser 在解析方面做得很好，但它似乎没有提供一种从FeedParserDict对象组合 XML 文档的方法。

有没有更简单的替代方法来编写我自己的作曲函数？

python feedparser

2011-05-06T20:08:44.400

0 投票

1 回答

226 浏览

python - 基于feedparser的应用

是否有基于 python 库的应用程序feedparser可以在 Ubuntu 下运行并显示提要的调度和存储？

谢谢你

python feedparser

2011-06-01T08:00:24.880

1 2 3 4 5 6 7 8 9 10

问题标签 [feedparser]

Reference