我目前使用此命令从站点中提取 URL
xidel https://www.website.com --extract "//h1//extract(@href, '.*')[. != '']"
这将提取所有 URL (.*),但我想以一种不会提取在其 URI 路径中包含特定字符串的 URL 的方式进行更改。例如,我想提取所有 URL,除了那些包含-text1-
和-text2-
此外,xidel 有一个名为garbage-collect 的函数,但我不清楚如何使用这些函数。我可以是
--extract garbage-collect()
或者
--extract garbage-collect()[0]
或者
x:extract garbage-collect()
或者
x"extract garbage-collect()
但是当使用--follow
.