我正在使用 XPath 从以下 URL 中提取某些元素:
http://gizmodo.com/how-often-cities-appear-in-books-from-the-past-200-year-1040700553
为了提取主要内容,我使用了以下查询:
//p[@class='has-media media-640']
但是,我想从这个主要内容中排除所有具有“放大镜灯箱”类的跨度。我查看了 StackOverflow 并尝试了各种方法,例如:
//div[@class='row post-content']/*[not(self::span[@class='magnifier lightBox'])]
无济于事。