我有一个包含<div>
带有 onclick="" 代码的标签的页面,该代码调用 ajax 请求以获取 json 数据,然后遍历结果以形成链接 ( <a />
) 以附加到页面。这些链接在我网站上的任何其他地方都不存在。如何使这些动态生成的链接可抓取?
我最初的想法是将<div>
标签变成<a>
带有 href="#" 的标签,但由于我对典型爬虫如何工作的了解有限,我认为这不会解决我的问题,因为 "#" 将是爬虫,不一定是动态生成的输出。除此之外,我根本不希望滚动定位被改变,这也将排除给<a>
标签一个 id 并让它引用自己。
除了创建一个包含我需要抓取的所有链接的新页面之外,我还有其他选择吗?谢谢。