1

我有一个 xpath 表达式,它使用“|”-操作符来选择网页的多个节点/div。

这是表达式:

hxs.select('//div[@class="cat"]/p|//div[@class="entry"]').extract()

但是当我输出结果时,我在第一个表达式的输出之间得到一个逗号

//div[@class="cat"]/p

第二个

//div[@class="entry"]

喜欢:

'Lorem ipsum', 'Ipsum Lorem'

有没有办法摆脱逗号?

喜欢:

'Lorem ipsum Ipsum lorem'

或者是否有更好的方法来编写选择 THIS div AND THIS div 的 xpath 表达式。

应用程序的其余部分是用 Python 编写的,但我认为这与问题无关。非常感谢任何帮助!

4

1 回答 1

1

使用join().

" ".join(hxs.select('//div[@class="cat"]/p|//div[@class="entry"]').extract())
于 2012-07-20T17:52:14.177 回答