0

我有一个需要检索的文件,然后我需要浏览该文件并下载所有列出的图像。格式是 xml,但我不想使用 xml 解析器。

当我使用

sudo wget --restrict-file-names=windows -nH -nd -r -i -P images \ -A jpeg,jpg,gif,png https://url.com/api/ojgnvhy75hGvcf36dnJO0947bsh62gbs?_=1361842359357 

我下载了 xml 文件,但我需要该文件中引用的图像。

我在这里做错了什么?

4

1 回答 1

0

我最终得到了以下代码,获取 xml 文件并将其保存为文本,然后使用 sed 从文本文件中获取链接并将其写入另一个文件,然后在该文件上使用 wget 下载图像。

#!/bin/破折号

wget -O xml.txt 'https://url_to_download_from'
链接=$(sed -n "/image>/s/^ .\([^>]*\)<\/image>.*/\1/gpw links.txt" xml.txt)
wget -N -P 图片 -A png -i $links

可悲的是,这会导致一堆不是图像的文件,即使我只请求图像。

此脚本完成后,我运行以下命令来清理文件夹。

cd 图片
shopt -s extglob nocaseglob
rm !(*.png)
于 2013-03-07T00:39:38.103 回答