似乎在没有问题的wget
情况下无法获取asp
文件html
。我编写了一个脚本来获取一些 URL 并将它们保存为csv
格式。脚本是
wget -qO- http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1 | sed 's+<br />++g' > $1.csv
您必须在该 URL 周围加上引号!不加引号,Bash(或您正在使用的任何外壳)将&
视为在后台运行的请求wget
- 以及格式参数,该参数来自&
永远不会发送到服务器。试试这个:
wget -qO- 'http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1' | sed 's+<br>++g' > $1.csv
请注意,我也调整了您的sed
命令-<br>
您得到的 s 没有终止斜杠。另外:删除那些<br>
s 意味着只有其他每一行都有数据。希望这不会是一个问题,因为删除换行符sed
有点痛苦,但如果是这样,请参阅这个问题以了解如何操作。
希望有帮助!