我正在用python进行网页布局分析。一项基本任务是以编程方式测量给定 HTML 源代码的元素大小,以便我们可以获得网页语料库的内容/广告比率、广告块位置、广告块大小的统计数据。
一个明显的方法是使用宽度/高度属性,但它们并不总是可用的。此外,width: 50%
需要在加载到 DOM 后进行计算。所以我猜想将 HTML 源代码加载到 window-size-predefined-browser 中(比如mechanize虽然我不确定是否可以设置窗口的大小)是一个很好的尝试方法,但是 mechanize 不支持返回无论如何元素大小。
是否有任何通用方法(没有宽度/高度属性)在 python 中执行此操作,最好使用一些库?
谢谢!