1

我不确定这是否是正确的部分。

到目前为止,我已经为意大利足球新闻网站(Pianeta Lecce)制作了一个 HTML iphone webapp。

我的 webapp 有一个标签栏,您可以在其中根据主题选择新闻,我成功地做到了这一点,这要归功于我用来从网站上抓取新闻的PHP Simple Html DOM Parser( PHP Simple HTML Dom Parser )。

现在这就是问题所在:如果我单击带有图片和新闻简短摘要的链接,它显然会加载新闻的外部页面。但这不是我想要的:我想要的是,当我点击新闻时,它应该以某种方式 创建一个页面,其中的新闻内容再次从引用该新闻的网站页面中抓取(我只需要图片和新闻!)。

我认为这是一个非常好的问题,但我真的不知道实现这一目标的最佳方法是什么,尤其是关于简单性的问题。

因此,我希望您向我建议可能的方法以及您将如何做到这一点。还请记住,这是一个 iPhone 网络应用程序

谢谢!

4

1 回答 1

0

我分三步完成:

  1. 从网络上抓取内容
  2. 规范化内容并将其添加到您的数据库中
  3. 从您的数据库中以已知形式提供新闻详细信息

这样,您的应用程序不依赖于您正在抓取的任何网站,因为您提供相同的元素 - 标题,新闻的简短预览和链接 - 由您的抓取工具存储在您的数据库中的元素。

除此之外,您还可以更好地控制抓取过程,并能够监控坏消息。

于 2013-01-01T16:32:21.773 回答