4

我用 HTTrack 下载了 sonst.cc,但是离线查看时没有内容。每个选项卡都是空的。这是为什么?

是否有任何其他应用程序可以让我下载整个内容?

我在这里失去理智了。

谢谢。

编辑:

当我打开使用 HTTrack 下载的索引文件时,在 Safari 中,首页加载得很好,背景图像、菜单……一切都很完美!除非我单击任何菜单,否则选项卡会打开为空!完全没有内容!!!也就是说,它下载了整个站点……html、css、js、图像……当我查看代码时,一切似乎都很好。这一切都在那里!

截屏

索引.html

<html>
  <head>
    <title>SONST</title>
    <meta http-equiv="content-type"     content="text/html;charset=UTF-8" />
    <meta name="title"          content="SONST" />
    <meta name="doc-type"           content="Web Page" />
    <meta name="Content-Language"       content="en" />
    <meta name="author"         content="Brill Webdesign, Eindhoven" />
    <meta name="web_author"         content="Brill Webdesign, Eindhoven" />
    <meta name="production"         content="Brill Webdesign - http://www.brill-webdesign.nl" />
    <meta name="copyright"          content="2015, Brill Webdesign" />
    <meta name="keywords"           content="" />
    <meta name="description"        content="" />
    <meta name="classification"     content="Business and Economy" />
    <meta name="Rating"         content="General" />
    <meta name="revisit-after"      content="5 Days" />
    <meta name="doc-class"          content="Living Document" />
    <meta name="robots"         content="all" />
    <meta http-equiv="imagetoolbar"     content="no" />
    <link rel="Shortcut Icon"       href="favicon.html" type="image/x-icon" />
    <link rel="icon"            href="favicon.html" type="image/x-icon" />
    <link rel="stylesheet"          href="css/styles.css" type="text/css" charset="utf-8" />
    <link rel="stylesheet"          href="css/slideshow.css" type="text/css" media="screen" />

    <script type="text/javascript"      src="scripts/mootools-core-1.3.1-full-compat-yc.js"></script>
    <script type="text/javascript"      src="scripts/mootools-more-1.3.1.1.js"></script>
    <script type="text/javascript"      src="scripts/interface.js"></script>
    <script type="text/javascript"      src="scripts/slideshow.js"></script>
    <script type="text/javascript"      src="scripts/fitimage.js"></script>

    <script type="text/javascript">
        window.addEvent('domready', function()
        {
            new FitImage('files/impressionen/SONST-Wald.jpg');
        });
    </script>

</head>
<body>

    <div id="show"></div>

    <div id="menu">
                    <a href="page5cf1.html?page=aktuelles&amp;l=">Aktuelles</a> /
        <a href="pagee4c7.html?page=angebot&amp;l=">Angebot</a> /
        <a href="page6e95.html?page=projekte&amp;l=">Realisierte Projekte</a> /
        <a href="page0c6a.html?page=referenzen&amp;l=">Referenzen</a> /
        <a href="pagee1df.html?page=kontakt&amp;l=">Kontakt</a> /
        <a href="paged192.html?page=impressum&amp;l=">Impressum</a>
                </div>

    <div id="wrapper">

        <div id="block_01" class="block">
            <div class="remove">
                <a href="#" onclick="slidepic();slide04();slide03();slide02();slide01();resetDelay();">&times;</a>
            </div>
            <div id="block_01_inner"></div>
        </div>

        <div id="block_02" class="block">
            <div class="remove">
                <a href="#" onclick="slidepic();slide04();slide03();slide02();resetDelay();">&times;</a>
            </div>
            <div id="block_02_inner"></div>
        </div>

        <div id="block_03" class="block">
            <div class="remove">
                <a href="#" onclick="slidepic();slide04();slide03();resetDelay();">&times;</a>
            </div>
            <div id="block_03_inner"></div>
        </div>

        <div id="block_04" class="block">
            <div class="remove">
                <a href="#" onclick="slidepic();slide04();resetDelay();">&times;</a>
            </div>
            <div id="block_04_inner"></div>
        </div>

        <div id="block_pic" class="block" rel="off">
            <div class="remove" style="height: 0;">
                <a href="#" onclick="slidepic();resetDelay();" id="close_pic">&times;</a>
            </div>
            <div id="block_pic_slideshow" rel="0" onclick="javascript:next_pic(); return false;"></div>
        </div>

    </div>

    <div class="introLogo">
        <img src="images/logo.png" alt="sonst" width="920" height="291" border="0" />
    </div>
    <div class="lang">
        <a href="index124c.html?l=e">E</a> / <a href="index1d70.html?l=d">D</a>
    </div>
</body>

4

3 回答 3

3

一些服务器从浏览器请求标头。要模仿这种确切的行为,请按照下列步骤操作:

  1. 在浏览器上按 F12 并查找“网络”或“网络”选项卡
  2. 打开你要下载的网页
  3. 展开列表中的第一项,应该是 GET 请求
  4. 检查它在哪里显示“标题”。如果您在 Firefox 中使用 Firebug,您也可以点击“查看源代码”
  5. 通过用鼠标绘制它们并按 CONTROL+C 来复制所有在“主机:”行上的标题
  6. 转到 HTTrack 并单击当前下载的“设置选项”按钮(在 url 下)。
  7. 转到“浏览器 ID”选项卡,将“浏览器身份”留空,HTML 页脚“(无)”并在“附加 HTTP 标头”上粘贴您在步骤 #5 中复制的内容
  8. 你都准备好了。
于 2016-11-02T14:51:48.973 回答
0

我做了一个wget -p -k http://sonst.cc并得到了 index.html 及其所有相关的 css 和 js 文件。

背景图像没有被拉出,但除此之外,页面看起来还不错。 儿子.cc

我检查了标签,确实它们不起作用。仔细检查显示他们在单击时从外部 php 文件加载内容:

开发工具

由于PHP文件是服务器端处理的,自然wget还是httrack拿不到代码,所以无法加载相关内容。当它试图从服务器中提取它时,我收到一个Access Control 跨域错误

错误

如果您真的想要页面的工作版本,鉴于标签数量相对较少,您可以手动复制 php 脚本中的响应并编辑 jsindex.html以从本地响应副本加载标签。

于 2015-01-10T16:18:10.473 回答
0

对于 gui 版本。在网址 (URL) 中设置所有必要的下载链接:

https://ok.mysite.com/src/js.js
https://ok.mysite.com/src/css.css
https://ok.mysite.com/src/
https://ok.mysite.com/folder/iwrHelp
https://ok.mysite.com/folder/mlnHelp
https://ok.mysite.com/folder/mlnRatings
https://ok.mysite.com/folder/iwrVariants
https://ok.mysite.com/folder/millionaire
https://ok.mysite.com/folder/
https://ok.mysite.com/favicon.ico
https://ok.mysite.com/
https://ok.mysite.com/src/erc
https://ok.mysite.com/src/jquery.js
https://ok.mysite.com/src/ico.ico
https://ok.mysite.com/src/bg.jpg
https://ok.mysite.com/src/fonts/font.eot
https://ok.mysite.com/src/fonts/font.otf
https://ok.mysite.com/src/fonts/
https://ok.mysite.com/src/fonts/font.ttf
https://ok.mysite.com/src/fonts/font.woff
https://ok.mysite.com/src/folder/gif.gif
https://ok.mysite.com/src/folder/jpg.jpg

dir /ogen /a /p /s /b *.*如果这是您的站点,则可以使用操作系统命令 (cmd)或类似的 bash轻松获取链接路径。c:\site并替换记事本中的所有内容,例如:https://ok.mysite.com

检查所有上传文件的大小,如果大小为0,则需要手动上传文件或重新上传并再次检查所有文件的大小为0,查看httrack错误日志。

于 2022-01-13T15:39:02.587 回答