0

似乎在没有问题的wget情况下无法获取asp文件html。我编写了一个脚本来获取一些 URL 并将它们保存为csv格式。脚本是

wget -qO- http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1 | sed 's+<br />++g' > $1.csv
4

1 回答 1

1

您必须在该 URL 周围加上引号!不加引号,Bash(或您正在使用的任何外壳)将&视为在后台运行的请求wget- 以及格式参数,该参数来自&永远不会发送到服务器。试试这个:

wget -qO- 'http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1' | sed 's+<br>++g' > $1.csv

请注意,我也调整了您的sed命令-<br>您得到的 s 没有终止斜杠。另外:删除那些<br>s 意味着只有其他每一行都有数据。希望这不会是一个问题,因为删除换行符sed有点痛苦,但如果是这样,请参阅这个问题以了解如何操作。

希望有帮助!

于 2012-10-27T14:20:33.217 回答