我正在使用 django-dynamic-scraper aka DSS (django+scrapy) 学习 xpath 和网络抓取,并尝试使用以下代码从网站检索数据:
<tr valign="top">
<td align="center" valign="top">
<p><img src="someimage.jpg"></p>
</td>
<td>
</td>
<td>
<div align="left">
<span class="style1">
<strong>Title1</strong>
</span>
<span class="style2">Title2:</span>ContentA<br />
<span class="style2">Title3:</span>ContentB<br />
<span class="style2">Title4:</span>ContentC<br />
</div>
</td>
</tr>
我的问题:
an URL object of DSS
如果该代码没有链接,xpath 是什么?- 如果 first 没有类,检索图像文件的 xpath 是什么
<td>
? - 如果跨度的类是,如何从 ContentA、ContentB 和 ContentC中检索每个
same
数据的数据?