0

我有带有 css 的 html,我想检查 html 文档中指定文本的真实颜色(和其他可视文本属性)是什么。我可以用 JSoup 做到这一点,还是必须寻找一些真正的 html 引擎/处理器?处理此操作的速度是主要因素之一。

4

5 回答 5

1

我认为他想在 Java 程序中检索这些数据。所以你需要做的事情很少。

  1. 下载样式表文件。
  2. 解析 html 并找到类属性。
  3. 将 css 中的 .class 与 html 属性匹配并找到您想要的特定信息。

但要注意,如果您想查找有关任何没有属性的 html 元素的信息。在这种情况下,您需要找到 html 元素的 xpath,例如:

<table class="entityTable">
<tr>
<td> <input type="text" value="abcdef" /></td>
</tr>

然后你需要找到像这样的xpath:body/div/.../table/tr/td/input,你需要匹配任何可以影响你的输入标签属性的css规则。

.entityTable tr td input
{
 color:red;
}

这要困难得多,因此如果要解析的 html 是您的页面,则将无处不在的类属性放入您的 html 标记中。否则,您需要找到将 html 标签匹配到 css 规则的方法。

干杯。

于 2011-01-19T11:14:01.390 回答
1

尽管它仍处于测试阶段,但Cobra HTML 解析器具有此功能。

于 2011-01-19T11:23:15.010 回答
0

CSSBox is definitely what you want. It allow you to load external css and transform it in inline style for every dom element.

http://cssbox.sourceforge.net/manual/

于 2011-07-03T01:38:47.553 回答
0

If you're doing this in an applet, you can use javascript to collect the information, and pass it to your applet.

于 2011-07-03T01:43:01.120 回答
0

如果您需要了解网页中对象的准确信息,
例如标准 HTML 表格的默认边框或标准链接的颜色,
请使用 FireFox 的 FireBug 扩展。

于 2011-01-19T10:44:48.923 回答