0

我所发现的只是到目前为止如何解析内容。解析内容对我来说不是问题,我只是不清楚如何获取内容!如果我有一堆 XML 文件放在一个文件夹中,我可以轻松地筛选并处理它们,我只是不知道如何将它们放在文件夹中。

我也可以爬到文件的位置并以这种方式抓取它们,但我发现的所有提要似乎只是新闻报道的链接等等,而且它们都不是 XML。

我不想使用任何第三方 CMS,例如 Drupal 或 Wordpress。对不起,如果这是一个愚蠢的问题。提前感谢您的帮助!

编辑:我昨晚进行了搜索,现在我再次搜索并在五秒钟内在我正在寻找的新闻网站上找到了一个纯 XML RSS 提要,而我昨晚找不到。而不是提供可下载的文件,这就是 RSS 提要通常提供的全部内容吗?可浏览的文件/页面?

EDIT2:是的,看起来就是这样。对不起大家!好吧,希望有类似问题的人能得到帮助。

EDIT3:好吧,既然我现在创建了线程,任何人都可以告诉我 SimpleXML 或解析(比如 Magpie)是否会更快,处理方式?我的假设是 SimpleXML 是要走的路。

4

2 回答 2

0

有很多可供阅读的选项,但我喜欢使用 ttp://magpierss.sourceforge.net/

于 2013-03-07T04:48:44.733 回答
0

我不确定这是你想要的,但是,这对你有用吗?

wget -q -O-  "http://www.tuxradar.com/rss"

我在 PC 上的 Cygwin 中做到了这一点,但是,它可以在 Linux 或 Mac 终端上运行。如果需要,您还可以将输出重定向到文件:

wget -q -O-  "http://www.tuxradar.com/rss" > tux.xml
于 2013-03-07T04:49:33.537 回答