0

我正在使用 django-dynamic-scraper aka DSS (django+scrapy) 学习 xpath 和网络抓取,并尝试使用以下代码从网站检索数据:

<tr valign="top">
    <td align="center" valign="top">
        <p><img src="someimage.jpg"></p>
    </td>
    <td>
    &nbsp;
    </td>
    <td>
        <div align="left">
            <span class="style1">
                <strong>Title1</strong>
            </span>
            <span class="style2">Title2:</span>ContentA<br />
            <span class="style2">Title3:</span>ContentB<br />
            <span class="style2">Title4:</span>ContentC<br />
        </div>
    </td>
</tr>

我的问题:

  • an URL object of DSS如果该代码没有链接,xpath 是什么?
  • 如果 first 没有类,检索图像文件的 xpath 是什么<td>
  • 如果跨度的类是,如何从 ContentA、ContentB 和 ContentC中检索每个same数据的数据?
4

1 回答 1

1

如果该代码中没有链接,DSS 的 URL 对象的 xpath 是什么?

无法回答问题,能解释一下吗?

如果 first 没有类,检索图像文件的 xpath 是什么?

//tr[1]/td[1]//img/@src

如果跨度的类相同,如何从 ContentA、ContentB 和 ContentC 中检索每个数据的数据?

//text()[preceding-sibling::span[@class="style2"]]

于 2013-02-22T12:30:33.733 回答