我正在处理遵循以下结构的 HTML。我想忽略“随机文本”并想用 CSS 选择器拉出“我想要的文本”。
我现在使用的选择器正在提取所有文本:
variable = page.css('div.eight.columns.listingDetail p')
这是 HTML:
<div class="eight columns listingDetail">
<p>
<span class="bold">RANDOM TEXT</span>
TEXT I WANT 1
</p>
<p>
<span class="bold">RANDOM TEXT</span>
<span class="bold price">
TEXT I WANT 2
<span></span>
</span>
</p>
<p>
<span class="bold">RANDOM TEXT</span>
</p>
<p>
<span class="bold">RANDOM TEXT</span>
TEXT I WANT 3
</p>
</div>