我正在编写一个试图确定页面上是否有广告的应用程序。这目前正在使用 python 通过 selenium webdriver 使用浏览器驱动。
我认为 iframe 中存在大量广告,我制作了一个循环来查看每个框架的内部
browser = webdriver.Chrome()
browser.get("http://cnn.com")
all_iframes = browser.find_elements_by_tag_name("iframe")
for iframe in all_iframes:
browser.switch_to_frame(iframe)
print(browser.page_source)
browser.switch_to_default_content()
browser.quit()
我想知道是否有任何一致发现的标签或标签参数,我可以在多个页面上使用它们来确定页面上是否有广告(页面上的 iframe 内外)。我是否必须在每个框架内寻找诸如双击或adtech或adblade之类的东西?
或者我是否必须生成不同的规则来逐页检查?
任何人都知道广告是如何在页面上显示的?谢谢。