3

我目前正在做一个研究项目,我正在尝试找出一种好的方法来识别可以访问网页 html 的广告。

我认为从 AdBlock 开始可能是个好主意。AdBlock 是一个阻止向用户显示广告的程序,因此推测它具有将事物识别为广告的机制。

我下载了 AdBlockPlus 的源代码,但我发现自己完全迷失在所有文件中。我不确定从哪里开始寻找这种检测机制,所以我想知道是否有人对从哪里开始有任何建议。或者,如果您之前处理过 AdBlock 并且熟悉它,我将不胜感激任何额外的信息。

例如,如果网页需要在真正的浏览器中呈现才能使用 Adblock,有些程序会自动加载网页,所以这不是问题,但我不知道如何弄清楚这是否是什么AdBlock 首先是这样做的。

注意:AdBlock 是用 Python 和 Perl 编写的 :)

谢谢!

4

1 回答 1

3

我建议您先看看编写adblock 过滤规则

然后,一旦您了解这一点,您就可以开始解析各种语言的广告屏蔽列表以满足您的需求。

于 2012-02-25T02:54:12.113 回答