我正在尝试从本网站的多个搜索结果页面中抓取“阅读更多”链接:https ://www.cgg.com/en/31
没有指向搜索结果的任何特定页面的规范链接。当您导航到第 2 页时,URL 仍然是https://www.cgg.com/en/31。
在检查底层 HTML 和 JavaScript 后,我看到分页链接在单击时会触发 JavaScript 函数。
<a href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$ctl00$Layout-7-main-partial2$TmsPager1$ctl02$ctl00','')">NEXT</a>
这是被调用的函数:
<script type="text/javascript">
//<![CDATA[
var theForm = document.forms['form1'];
if (!theForm) {
theForm = document.form1;
}
function __doPostBack(eventTarget, eventArgument) {
if (!theForm.onsubmit || (theForm.onsubmit() != false)) {
theForm.__EVENTTARGET.value = eventTarget;
theForm.__EVENTARGUMENT.value = eventArgument;
theForm.submit();
}
}
//]]>
</script>
因此,通过单击“NEXT”,浏览器将被重定向到相同的 URL,但内容不同。
单击“下一步”按钮后,我想从下一页抓取“阅读更多”链接。由于单击“下一步”按钮实际上会提交表单并重新加载页面,我将如何使用 AngleSharp 执行此操作?
这是我到目前为止所拥有的:https ://dotnetfiddle.net/3f6XZC