我知道已经问过类似的问题,但我想知道是否存在一些代码\包,或者关于如何判断两个 url 是否是同一个页面的一些想法。
为了激励,假设我想做的是编写一个 chrome 扩展程序,告诉你有多少你的 facebook 朋友访问了一个链接。
当然,简单地比较 url 是行不通的,因为某些 url 参数可能很关键,而其他参数则不是,例如,与参数关键google.com?query=help
的页面不同,而与(我当然正在编造这些示例)相同。google.com?query=idea
query
google.com?referrer=facebook
google.com?referrer=twitter
此外,比较页面的内容并不能保证有效,好像有随机部分(“相关故事”)或用户特定内容(标题“嗨,诺姆,我们有一段时间没见到你了”)。
当然,我并不是在寻找一种万无一失的方法,只是在大多数正常行为的网站上都可以使用。
关于如何做到这一点的包(任何语言)或想法的任何好的建议?