1

我正在尝试使用 jsoup 来解析 html 文件。它是使用表格来展示产品的。每个产品都在一个表中,其 id 范围从 1 到“n”。就像下面的例子:

<table align="center" width="98%" id="A + 1">
   <tbody>
      <tr>
         <td valign="top" style="width: 03%;">
            <span class="line">1</span>
         </td>
         <td valign="top" style="width: 56%;">
            <span class="line">PRODNAME</span>
         </td>
         <td valign="top" style="width: 10%;">
            <span class="line">850.000</span>
         </td>
      </tr>
   </tbody>
</table>

所以第一个产品将在桌子上,id 为“A + 1”,第二个产品在“A + 2”中,依此类推。

我无法使用选择器来遍历这些表。我正在做:

Document doc = Jsoup.parse(html);
Elements products = doc.select("table[idˆ=A]");
for (Element product : products) {
   // do something
}

如果我没看错(http://jsoup.org/apidocs/org/jsoup/select/Selector.html),doc.select("table[idˆ=A]")应该检索id属性以“A”开头的所有表......

但是我的 Elements 对象(产品)是空的......我做错了什么?

我在带有 Netbeans 7.1.2 的 Mac OS X (10.7.4) 上使用 jsoup 1.6.3、java 1.6.0_31。

任何帮助表示赞赏。

4

1 回答 1

3

您似乎在选择器中使用了错误的抑扬符,尽管我不确定 jsoup 是否应该返回空结果集或在无效选择器上抛出异常。

无论如何,试试这个:

Document doc = Jsoup.parse(html);
Elements products = doc.select("table[id^=A]");
for (Element product : products) {
   // do something
}
于 2012-06-02T09:36:15.900 回答