html - 使用 Scrapy 提取数据：可能是跟随兄弟姐妹？

Question

我是一个使用 Scrapy 获取各种数据的菜鸟，需要一些帮助。我浏览了论坛，但无法从示例中找出如何解决我的问题。这是HTML

<section>
<div class="profile-details" >
    <div >
        <h5 style="margin-bottom:0px;">Contact Details</h5><div class="profile-phone">
            <table>
                <tbody>
                    <tr>
                        <th>Phone</th>
                        <th class='phone-number'>XX XXX XXXX</th>
                    </tr>

在电话号码的情况下，我有这个

item['phone'] = content.select('//*[@id="listing"]/section/div[1]/div/div[1]/table/tbody/tr[1]/th[2]').extract()

返回<th class="phone-number">XX XXX XXXX</th>到“电话”字段

但是，我只想返回“XX XXX XXXX”。方法是否following-sibling正确，和/或如何更改我的代码以仅检索“XX XXX XXXX”？

谢谢，不要害怕菜鸟！

score 1 · Accepted Answer

你html的无效。无论如何，您都需要以下text()功能：

item['phone'] = content.select('//*[@id="listing"]/section/div[1]/div/div[1]/table/tbody/tr[1]/th[2][@class="phone-number"]/text()').extract()

html - 使用 Scrapy 提取数据：可能是跟随兄弟姐妹？

1 回答 1

Related

Reference