我正在尝试创建一个从网页检索信息的 Java 应用程序。这是我试图访问第二个 tr 标记中第一个 td 标记中的值的代码的一部分:
<TABLE CLASS="datadisplaytable" width = "100%">
<TR>
<TD CLASS="dddead"> </TD>
<TH CLASS="ddheader" scope="col" ><SPAN class="fieldlabeltext">Capacity</SPAN></TH>
<TH CLASS="ddheader" scope="col" ><SPAN class="fieldlabeltext">Actual</SPAN></TH>
<TH CLASS="ddheader" scope="col" ><SPAN class="fieldlabeltext">Remaining</SPAN></TH>
</TR>
<TR>
<TH CLASS="ddlabel" scope="row" ><SPAN class="fieldlabeltext">Seats</SPAN></TH>
**<TD CLASS="dddefault">46</TD>**
<TD CLASS="dddefault">46</TD>
<TD CLASS="dddefault">0</TD>
</TR>
这就是我现在所拥有的,但这仅返回 td 标签的类,而不是其中的值:
List<?> table = page.getByXPath("//table[@class='datadisplaytable'][1]//tr[2]/td");
我将如何获取 td 标签的值而不是其属性?
编辑:上面的代码返回这个:
HtmlTableDataCell[<td class="dddefault">]