-1

我正在使用这段代码,试图弄清楚如何通过 XPATH 提取标题信息,并且由于它位于内部网络上,因此我无法访问 Firepath 之类的东西。

<div style="float:left">
<table border="0">
<tbody>
   <tr width="100%">
      <td valign="top">Code that does not matter</td>
      <td colspan="2">
          <span class="textinfo">
          <a href="http.....">
             <b> HI!  I am the TITLE!</b>
          </a>
          </span>
      </td>
   </tr>
   <tr></tr>
   <tr></tr>
   <tr width="100%">
      <td valign="top">Code that does not matter</td>
      <td colspan="2">
          <span class="textinfo">
          <a href="http.....">
             <b> HI!  Here is another TITLE!</b>
          </a>
          </span>
      </td>
    </tr>
   </tbody>
  </table>
  </div> 

这种情况持续了一段时间。基本上有 10 个结果,我试图弄清楚如何获得所有标题。有任何想法吗?我是否提供了足够的信息?谢谢!

4

1 回答 1

1

您在示例中拥有的不是有效的 XML,它应该有一个根元素。如果我们假设没有定义命名空间(不应该有),那么......

您可以使用元素的内部文本:

//td/span[@class='textinfo']/text()

我不会把aand放在b那里 - “禁用”标题不会有a例如。无论哪种情况,使用 XPath 查找“标题”都不是一种非常可靠的方法

于 2013-04-05T18:53:22.720 回答