我正在尝试检测网页中不同元素的颜色(保存在机器上)。目前我正在尝试用python编写代码。我遵循的最初方法是:
- 使用正则表达式在不同标签的 html 文件中查找颜色词。
- 尝试读取十六进制值。
但是这种方法非常愚蠢。我是网站设计的新手,请您帮帮我。
可以有多个样式表和许多级联样式。您不知道哪些元素在视觉上最终成为“背景”元素。我认为,如果您正在寻找适用于大多数网页的强大功能,您需要利用浏览器渲染引擎并专注于识别用户会看到什么。
考虑使用 Web 浏览器来呈现页面,截取屏幕截图,然后进行图像处理以找到页面两侧最常见的颜色。您可以使用像phantomjs这样的可编写脚本的浏览器。
如果您是编程新手,那么这种方法会让您难以接受。
在java中,您可以使用JSOUP。这是相当不错
Document doc = Jsoup.connect("http://YourPage.html").get();
Elements colors = doc.select("[bgcolor]");
我对 Java 或 Python 一无所知,但你能让它解析 html 代码并寻找类似“背景颜色:<颜色>”的东西吗?