我是这个领域的新手,我需要更多信息。我在互联网上找不到任何信息。例如现在我使用这个功能hxs.select('//div[@id="CategoryBreadcrumb"]//text()').extract()
。在这方面,除了一个之外,div
我都有ul
和li
s 与a
nchors li
。我需要其中li
没有a
标签的文本。如果您也提供任何有关 hxs 过滤的教育链接,我将不胜感激。提前致谢!如果您无法想象我需要什么,这是一个示例。
<div id='CategoryBreadcrumb'>
<ul>
<li><a href=#>I dont need</a></li>
<li><a href=#>I dont need</a></li>
<li><a href=#>I dont need</a></li>
<li>Text that i need</li>
</ul>
</div>