我有这个 html 片段:
<tr>
<th scope="row" style="text-align:left;">Appeared in</th>
<td class="" style="">1972<sup id="cite_ref-dottcl_2_2-0" class="reference"><a href="#cite_note-dottcl_2-2"><span>[</span>2<span>]</span></a></sup></td>
</tr>
<tr>
<th scope="row" style="text-align:left;">Usual
<a href="/wiki/Filename_extension" title="Filename extension">filename extensions</a>
</th>
<td class="" style="">.h .c</td>
</tr>
我正在使用//th//text()
表达式来解析它。
问题是它正在返回['Appeared in', 'Usual', 'filename extensions']
。
我想要的是['Appeared in', 'Usual filename extensions']
。