1

我正在尝试扫描网页并获取以下信息:

对于每个包含颜色的块(例如:“div”、“p”、“a”等),我想得到:

1) 文字和背景颜色

2)背景颜色区域(以像素为单位)

3) 文本的字体大小

HTML结构

这似乎是一项容易的工作,但是..

问题:

如您所知,HTML 元素是由父元素和子元素组成的,颜色将由子元素决定(除非它们未定义并且父元素决定了样式......)

所以我运行所有的后代并获得他们的风格,以防风格没有定义我去父母那里从那里得到它。

但问题是有时有些后代没有给我完整的信息(例如“p”标签内的“强”标签 - 在这种情况下,我将只有“p”标签内的粗体文本..)另一个问题是标签未定义但客户端仍然可以看到(例如“table”标签中缺少“td”标签)。

当然,为了解决这个问题,我可以得到父母并扣除面积,但它会非常复杂并且运行时间很长。

我的问题: 有没有其他更简单的选择来获得客户看到的颜色区域?

4

0 回答 0