对于 5 MB 的文档,以下查询需要libxml2
3 秒来评估。我能做些什么来加快速度吗?我需要生成的节点集进行进一步处理,所以 nocount
等。
谢谢!
descendant::text() | descendant::*
[
self::p or
self::h1 or
self::h2 or
self::h3 or
self::h4 or
self::h5 or
self::h6 or
self::dl or
self::dt or
self::dd or
self::ol or
self::ul or
self::li or
self::dir or
self::address or
self::blockquote or
self::center or
self::del or
self::div or
self::hr or
self::ins or
self::pre
]
编辑:
按照Jens Eratdescendant::node()[self::text() or self::p or ...
的建议使用(参见接受的答案)显着提高了速度;从最初的 2.865330s 到刚刚完美的 0.164336s。