我对此有一些想法,但我可以看到两者都有问题。我不需要 100% 准确的数据。一个 80% 的解决方案可以让我概括我将用户路由到的最流行的域。
选项 1 - 使用 PHP。通过一个文件路由链接,该文件track.php
确保引用页面来自我的域,然后再跟踪点击。然后,此页面将用户路由到最终的预期 URL。显然,机器人可以欺骗这一点。做很多?我还可以检查用户代理。再说一次,我知道很多机器人都在欺骗这一点。
选项 2 - 使用 JavaScript。执行 JavaScript on click 函数,将点击写入数据库,然后将用户定向到最终 URL。
这两种方法都感觉可能会导致跟踪我的传出链接的爬虫出现问题。跟踪这些传出点击的最有效方法是什么?