我发现wget some_url
它有很多空格和空行,例如
<span class="meta">
someValue
</span>
正如我们在 Chrome 开发工具中看到的那样,下载的整个文档wget
布局良好,文档是否有这么多空格和空行(或制表符),并且它们与主要内容一样被下载。
例如,如果文档(也可以通过 wget 或 curl 下载)是:
<div class=" someclass">
somevalue
</div>
有 5 个空格(之前 3 个someclass
,之前 2 个</div>
)和 2 个空行换行somevalue
是否以严格的形式下载,例如:
<div class="someclass">somevalue</div>
如果不是,我对这些大多无用的信息浪费了一些带宽这一事实感到震惊,是吗?浪费的(除了它们是为了布局目的)?