9

我正在编写一个试图确定页面上是否有广告的应用程序。这目前正在使用 python 通过 selenium webdriver 使用浏览器驱动。

我认为 iframe 中存在大量广告,我制作了一个循环来查看每个框架的内部

browser = webdriver.Chrome()
browser.get("http://cnn.com")

all_iframes = browser.find_elements_by_tag_name("iframe")

for iframe in all_iframes:
   browser.switch_to_frame(iframe)
   print(browser.page_source)
   browser.switch_to_default_content()

browser.quit()

我想知道是否有任何一致发现的标签或标签参数,我可以在多个页面上使用它们来确定页面上是否有广告(页面上的 iframe 内外)。我是否必须在每个框架内寻找诸如双击或adtech或adblade之类的东西?

或者我是否必须生成不同的规则来逐页检查?

任何人都知道广告是如何在页面上显示的?谢谢。

4

1 回答 1

9

您可以按广告服务器搜索。

http://pgl.yoyo.org/as/serverlist.php?hostformat=adblockplus

查看其他项目并了解它们如何处理相同的任务会很有帮助:

http://adblockplus.org/en/source

于 2012-11-16T19:39:34.113 回答