我目前正在做一个研究项目,我正在尝试找出一种好的方法来识别可以访问网页 html 的广告。
我认为从 AdBlock 开始可能是个好主意。AdBlock 是一个阻止向用户显示广告的程序,因此推测它具有将事物识别为广告的机制。
我下载了 AdBlockPlus 的源代码,但我发现自己完全迷失在所有文件中。我不确定从哪里开始寻找这种检测机制,所以我想知道是否有人对从哪里开始有任何建议。或者,如果您之前处理过 AdBlock 并且熟悉它,我将不胜感激任何额外的信息。
例如,如果网页需要在真正的浏览器中呈现才能使用 Adblock,有些程序会自动加载网页,所以这不是问题,但我不知道如何弄清楚这是否是什么AdBlock 首先是这样做的。
注意:AdBlock 是用 Python 和 Perl 编写的 :)
谢谢!