问题标签 [feedparser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 python 中从 feedparser 解析不同的日期格式?
我正在尝试通过feedparser从两个不同的 RSS 提要中的条目中获取日期。
这是我正在做的事情:
他们是这样出来的:
我想达到可以轻松找出哪个更新的程度。
我尝试使用 Python 的 datetime 模块并搜索 feedparser 文档,但我无法解决这个问题。任何帮助将非常感激。
jquery - 使用 jQuery 解析 RSS
我想使用 jQuery 来解析 RSS 提要。这可以通过开箱即用的基本 jQuery 库来完成,还是我需要使用插件?
python - 在 Django 模板标签库中导入外部库时出错
因此,我正在尝试编写一个 Django 可重用应用程序,该应用程序提供了一种在页面上显示 Twitter 提要的方法。我很清楚它已经存在了 20 次。这是一个学术练习。:)
目录结构非常简单:
运行 Django shell 时,twitterfeed.py 中定义的函数可以完美运行。我也相信我有正确命名和注册的模板标签。
如您所见,我使用了出色的Universal Feed Parser。我的问题不在 UFP 本身,而是在导入模板标签库时无法调用 UFP。当我{% load twitterfeed %}
在 base.py 中时,我收到以下错误:
'twitterfeed' 不是有效的标签库:无法从 django.templatetags.twitterfeed 加载模板库,没有名为 feedparser 的模块
我使用以下语句导入 feedparser:
我能说的最好的,这个错误信息有点欺骗性。我认为加载模板库时会发生 ImportError,这是 Django 对它的解释。
有什么方法可以在我的可重用应用程序中导入 feedparser.py,而无需应用程序的用户将 feedparser 放置在他们的 PythonPath 中的某个位置?
谢谢!
php - 无法让类方法在 foreach 循环中工作 - php
我编写了一个类 Link ,它有一个方法 shortTolong() 这应该通过返回“位置”响应头来返回缩短 url 的真实 URL。我测试了它,它工作正常这里是代码
当我尝试在其他文件上使用此方法时,问题就开始了,该文件使用 FeedParser 来获取包含此短 url 的提要条目,我需要分析由于某种原因我得到的结果是短 url 而不是长的,这里是代码:
由于某种原因,我对 getUrl() 和 shortTolong() 得到了相同的结果,并且我确定这是一个错误。
任何想法为什么会这样?谢谢
编辑-我使用 curl_eror 向该方法添加了一个错误通知,我收到此错误消息:“libcurl 中不支持或禁用协议 http”,正如我所说,我从没有变化)我怀疑它也与使用 curl 的 FeedParser 有关....
python - feedparser 和谷歌新闻
我正在尝试使用带有 python 的通用 feedparser 从 Google 新闻下载新闻语料库(尝试进行一些自然语言处理)。我真的对 XML 一无所知,我只是在使用一个如何使用 feedparser 的示例。问题是我在从 RSS 提要获得的 dict 中找不到新闻的内容只是标题。
我目前正在尝试使用的代码是这样的:
我在这篇文章中得到的键只是标题、摘要、日期等......没有内容。
这是谷歌新闻的问题还是我做错了什么?有没有办法做到这一点?
python - Feedparser - 从 Google 阅读器中检索旧消息
我正在使用 python 中的 feedparser 库从本地报纸中检索新闻(我的意图是对这个语料库进行自然语言处理),并希望能够从 RSS 提要中检索许多过去的条目。
我不太熟悉 RSS 的技术问题,但我认为这应该是可能的(我可以看到,例如,Google Reader 和 Feedly 可以在我移动滚动条时“按需”执行此操作)。
当我执行以下操作时:
我只收到十几个条目。我在想几百个。如果可能的话,可能是上个月的所有条目。是否可以仅使用 feedparser 执行此操作?
我打算从 rss 提要中仅获取新闻项的链接,并使用 BeautifulSoup 解析整个页面以获得我想要的文本。另一种解决方案是使用爬虫跟踪页面中的所有本地链接以获取大量新闻项目,但我现在想避免这种情况。
--
出现的一种解决方案是使用 Google Reader RSS 缓存:
但是要访问这个我必须登录到谷歌阅读器。有人知道我是如何从 python 做到这一点的吗?(我真的对网络一无所知,我通常只会弄乱数值微积分)。
python - 'import feedparser' 通过 SSH 工作,但在浏览器中失败
我通过 SSH 安装 feedparser,使用
我这样做是因为我似乎没有正确运行“python setup.py install”的权限
我在“test.py”中运行以下 python 代码。
当我通过 SSH 登录时,代码运行良好。但是当我在浏览器中查看它时,它会打印
Cannot import feedparser.
有任何想法吗?
python - 如何生成带有任意标签和附件的 RSS
现在,我正在使用 PyRSS2Gen 生成一个 RSS 文档(重新联合对使用 feedparser 解析的 rss 提要的修改),但我不知道如何向项目添加不常见的标签。
原始提要有一个<show_id></show_id>
标签和一个附件
<enclosure url="http://url.com" length="10" type="" />
,我也需要将其包含在生成的版本中。
python - 在 python 中解析 Facebook 提要日期时间?
- 我正在使用 python 库“feedparser”阅读 Facebook 更新提要。
- 我遍历我的 Django 模板中的条目集合,并显示结果。
更新后的字段以我不熟悉的某种格式返回一个很大的长字符串。
2009 年 12 月 1 日星期二 23:55:52 +0000
我怎样才能...
A) 使用 Django 过滤器清除模板上 for 循环中的日期时间。
...或者...
B)在视图中解析日期并格式化更新的日期,本质上是在视图中迭代之前清理条目集合中的日期。
注意:我已经尝试了这两种方法。Django 的日期过滤器无法识别它,我试图解析字符串的 iso8601 库也没有。
有人有这方面的经验吗?谢谢你的帮助!
更新:
在 Django 模板中使用 feedparser 中的 updated_parsed 值效果不佳。但是这个东西的过滤器的 Django 片段已经存在!**
Django 片段: http: //www.djangosnippets.org/snippets/1595/
ruby - Ruby,为什么 FeedNormalizer 的使用会破坏 Classifier::CRM114
刚刚学习 Ruby,发现了一些奇怪的东西(至少对于 ansi-c 程序员来说)。
拥有 Mac OS X 10.6.2、ruby 1.8.7 (2008-08-11 patchlevel 72) [universal-darwin10.0]、feed-normalizer 1.5.1 和 crm114 1.0.3
运行上面的文件:
好吧,这只是演示。
现在取消注释该行#FeedNormalizer...
并在没有注释的情况下运行文件:
?!地球在这里发生了什么?为什么 FeedNormalizer 的使用会破坏 crm114(那些不相关)?如何调试这种情况?这是典型的另一个类打破其他类吗?是否也重新启动(嘿,这是 Mac ;))