17

我正在尝试使用 wget 工具下载网站的内容。我使用 -R 选项来拒绝某些文件类型。但是还有一些其他文件我不想下载。这些文件命名如下,并且没有任何扩展名。

string-ID

例如:

newsbrief-02

我如何告诉 wget 不要下载这些文件(它们的名称以指定字符串开头的文件)?

4

2 回答 2

40

因为(显然)v1.14wget接受正则表达式 :--reject-regex--accept-regex(默认情况下,如果编译支持--regex-type posix,可以设置为)。pcrelibpcre

请注意,您似乎每次通话--reject-regex只能使用一次。wget也就是说,|如果要在多个 regex 上进行选择,则必须在单个 regex 中使用:

wget --reject-regex 'expr1|expr2|…' http://example.com
于 2014-01-27T14:03:45.777 回答
10

您不能在wget -R键中指定正则表达式,但可以指定模板(如 shell 中的文件模板)。

答案看起来像:

$ wget -R 'newsbrief-*' ...

您还可以使用?和符号类[]

有关详细信息,请参阅信息 wget

于 2012-06-27T17:28:34.077 回答