我尝试使用 Feedjira 来协助对新闻源进行内容分析,但似乎 RSS 源现在只链接到内容,而不是像我在“ Feedjira 不添加内容和作者”中发现的那样将它们包含在 RSS 中。我打算使用 Feedjira 来获取文章的 URL,然后使用 Nokogiri 来抓取文章并挑选出相关部分。
问题是每个媒体的页面都有不同的格式,我需要知道 Nokogiri 从数据库(由 Feedjira 提供)获取 URL 的最佳方式,并取决于相关的提要标题(也是来自 Feedjira 的数据库同步)以特定方式抓取页面并将其保存到数据库中的单独表中。有人有什么建议吗?