0

嗨,我目前正在尝试从 RSS 提要中提取全文:http ://www.hu-berlin.de/pr/nachrichten.rss?cat=exz 。显示的只是简短描述和全文链接:

<item>
    <guid>http://www.hu-berlin.de/pr/nachrichten/nr1305/nr_130524_00</guid>
     <title>KOSMOS Summer University 2013 </title>
     <link>http://www.hu-berlin.de/pr/nachrichten/nr1305/nr_130524_00</link>
     <description>Frist verlängert: Anmeldung zum internationalen Forschertreffen bis 30. Juni möglich</description>
     <pubDate>Thu, 20 Jun 2013 00:00:00 +0200</pubDate>
  </item>

我可以完全像 R 一样使用xmlTreeParse

我想知道天气是否可以使用 XML 库直接在 R 中提取全文我发现了这个:Parse RSS feed using XML packagin R虽然它工作正常,但它对全文问题没有帮助。我找到了 rss-to-full-texr 转换器(例如:http ://fulltextrssfeed.com/ ),这正是我所需要的,但我无法实现它们。也许这会帮助其他人寻找相同的东西,或者没有人需要研究这个,因为在那种情况下它是如此基本我很抱歉我给你带来了麻烦。我将不胜感激任何帮助或有用的链接!

4

1 回答 1

0

RSS 提要 XML 数据没有全文。您必须获取链接,获取该网页,然后使用 R 的 HTML 解析工具对其进行解析,这在其他地方进行了详细描述。

RSS 被设计为一种摘要格式,然后人们应该去网页。

于 2013-08-30T12:55:25.440 回答