django - 刮无链接

Question

我正在使用 django-dynamic-scraper aka DSS (django+scrapy) 学习 xpath 和网络抓取，并尝试使用以下代码从网站检索数据：

<tr valign="top">
    <td align="center" valign="top">
        <p><img src="someimage.jpg"></p>
    </td>
    <td>
    &nbsp;
    </td>
    <td>
        <div align="left">
            <span class="style1">
                <strong>Title1</strong>
            </span>
            <span class="style2">Title2:</span>ContentA<br />
            <span class="style2">Title3:</span>ContentB<br />
            <span class="style2">Title4:</span>ContentC<br />
        </div>
    </td>
</tr>

我的问题：

an URL object of DSS如果该代码没有链接，xpath 是什么？
如果 first 没有类，检索图像文件的 xpath 是什么<td>？
如果跨度的类是，如何从 ContentA、ContentB 和 ContentC中检索每个same数据的数据？

score 1 · Accepted Answer

如果该代码中没有链接，DSS 的 URL 对象的 xpath 是什么？

无法回答问题，能解释一下吗？

如果 first 没有类，检索图像文件的 xpath 是什么？

//tr[1]/td[1]//img/@src

如果跨度的类相同，如何从 ContentA、ContentB 和 ContentC 中检索每个数据的数据？

//text()[preceding-sibling::span[@class="style2"]]

django - 刮无链接

1 回答 1

Related

Reference