1

我正在尝试使用html-xml-utils 7.4中的hxselect从网页中提取一些文本。据该男子称,hxselect 将接受以逗号分隔的 CSS 选择器列表。我有三个选择器:

/usr/local/bin/hxnormalize -x -i 0 -l 5000 https://domain.tld | /usr/local/bin/hxselect -s'\n' 'div#searchfieldouter, div#searchbutton, input.searchfield' > ~/result.html

代码在任何一个或两个选择器上都能正常执行。当我使用两个以上时,只有第一个和最后一个有任何效果。无论使用的选择器或选择器的数量如何,中间的似乎都被忽略了。

是我的错误还是hxselect

4

1 回答 1

0

选项:hxselect -c ....

hxnormalize -x -i 0 -l 5000 https://domain.tld |
   hxselect -s'\n' -c 'div#searchfieldouter, div#searchbutton, input.searchfield' > ~/result.html
于 2018-03-31T14:46:23.693 回答