我有一个包含以下内容的 html 文件。
...
<table><tbody>
...
<tr>
<td><span class="myclass">C</span>
<a href="/myurl" title="myclick">mytext</a>
tailing text
</td>
</tr>
...
</tbody></table>
...
我想提取信息并以以下格式写入 TSV 文件。
C<TAB>mytext<T>tailing text
到目前为止,我只能用这个 xpath 代码来提取前两列。谁能告诉我如何提取第三列?谢谢。
xidel -s -e '//table/tbody/tr/td/join((span, a), x:cps(9))' - < infile.html