0

我有一个脚本,它允许检索给定 url 的各种信息:JsFiddle

如您所见,元内容源自“baseUrl”(在脚本的开头)。该页面 (baseUrl) 上的所有 a href 也有一个 div (#links)。我的问题:如何获取链接的元内容而不是 baseUrl?

4

1 回答 1

0

您的脚本正在做的是加载主页并解析数据。为了获得链接网址上的元标记,您基本上需要使用链接网址再次运行脚本,而不仅仅是您的baseUrl. 如果你无限期地循环这个,你基本上已经构建了一个网络爬虫。

于 2012-09-20T09:42:37.223 回答