0

我正在尝试使用 wget 在此处使用此文件下载文件列表:http ://webdatacommons.org/downloads/2012-08/nquads/files.list

如此处所述:http ://webdatacommons.org/2012-08/stats/how_to_get_the_data.html#toc0

但我收到以下消息:

rbhagdev@rbhagdev-linux:~/RDF$ wget -i files.list
--2013-05-01 11:49:44-- http://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00000.nq.sort.gz%0Dhttp://webdatacommons。 org/downloads/2012-08/nquads/html-mf-geo-00001.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00002.nq。 sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00003.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/ html-mf-geo-00004.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00005.nq.sort.gz%0Dhttp://webdatacommons。 org/downloads/2012-08/nquads/html-mf-geo-00006.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-hcalendar-00000.nq。排序.gz 正在解析 webdatacommons.org (webdatacommons.org)... 129.13.253.75 正在连接到 webdatacommons.org (webdatacommons.org)|129.13.253.75|:80... 已连接。已发送 HTTP 请求,等待响应... 403 禁止 2013-05-01 11:49:44 错误 403:禁止。

如果我只在该文件中使用一行,它就可以工作。这表明这可能与换行符有关?我在 Ubuntu 上。有人可以建议为什么 wget 会这样吗?

4

1 回答 1

2

您必须替换文件的行尾字符。您可以使用此命令执行此操作

sed -e 's/\r/\n/g' files.list > files.list.new
wget -i files.list.new
于 2013-05-01T12:41:19.977 回答