问题标签 [httrack]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
30 浏览

hosting - 网站主机不见了 | 恢复旧网站

我的客户失去了他的网站托管,因为他没有支付过去 3 个月的费用,所以主机删除了他们服务器上的网站。现在我们在https://web.archive.org上有一个版本,我们如何恢复它,然后将它上传到另一个主机服务器上。

请帮助伙计们

0 投票
1 回答
84 浏览

python-3.x - 当我无法访问主机时,如何在 Mac 上下载/镜像使用 Iweb 构建的网站?

几年前,我在 mac 中使用 Iweb 创建了一个站点。但现在我没有 domain.sites 文件来编辑站点。此外,我无法访问托管帐户,因为我一直很活跃。我在 Windows 上使用 httrack website copier 和许多其他工具来克隆网站,但我没有得到好的结果。某些资源未在离线版本上加载。我怎样才能镜像该网站?

我也尝试了 python Wpull 和 linux wget 但没有好的结果。

我的网站是:http ://www.smith-lakehomes.com

0 投票
1 回答
616 浏览

curl - cookies.txt 不适用于 Httrack 版本 3.49-2

大家好,我正在使用 httrack 并使用 cookie 进行身份验证,但似乎我的 cookie 不适用于我正在使用的语法

我使用的cookie是这样的,它是由chrome扩展生成的

但是当我使用 curl 使用这个 cookie 时,它​​通常可以正常工作,知道为什么吗?我错过了 httrack 参数/选项上的某些内容吗?

0 投票
1 回答
255 浏览

javascript - 复制网站以在不使用 JavaScript 的情况下进行离线查看(html 和 .js 外部的脚本标签)

我正在尝试复制网站以供离线查看而没有任何依赖关系。

我想复制没有 SCRIPT 标记(特别是 javascript)和没有外部脚本 (.js) 的 HTML。

一直在尝试使用WGET --ignore-tagsHTTrack 来做到这一点,但它没有按预期工作。脚本被作为一个整体复制。

0 投票
1 回答
191 浏览

javascript - 检查和查看源代码中的不同源代码

当我正在寻找一个网站的源代码时,它在 view-source-code 的 body 块中向我展示了一些看起来随机的 JS 代码,如下所示:

当我查看检查元素代码时,它向我展示了以下内容: 在此处输入图像描述

这看起来像一个格式完美的 HTML 代码。我想要那个 HTML 代码,但我不能从检查元素中复制它。那么有什么方法可以获取该 HTML 代码吗? 或者如何将该 js 代码转换为 HTML

编辑

你好!我从检查元素复制了 html 代码(其中有那个 js 部分),我编辑了它(删除了一个 div),但它没有给出任何更改。我认为代码的 js 部分正在覆盖它。如果我删除整个 js 代码似乎不起作用。而且我无法编辑 js,因为无法理解和编辑。

0 投票
0 回答
100 浏览

web - 如何阻止 httrack 复制网站?

Httrack 可以下载任何网站服务器上存储的所有文件。我怎样才能阻止 httrack 这样做?我可以通过使用robot.txt 文件来实现这一点吗?

0 投票
1 回答
755 浏览

html - Httrack 将 wordpress 转换为 HTML

我正在尝试将一个 wordpress 网站转换为一个简单的 html/css 网站,但问题是每当我使用 httrack 时,它都会下载整个 wordpress 文件,这使我很难提取简单的 html/css 文件是否可以解决这个问题使用httrack?或任何其他方法?

0 投票
1 回答
99 浏览

php - 如何查找php网站下的目录结构和文件名?

如何在我不拥有的 PHP 网站下获取目录结构和文件名?不是代码,只是结构和文件名。?我试过httrack,但由于它是一个PHP网站,它不起作用。

0 投票
1 回答
126 浏览

javascript - 使用 Javascript 检测 URL 和重定向 URL

我有一个关于如何使用 Javascript 检测域 url 和重定向 url 的问题。

如果 url 不是我的域,我的意思是重定向 url。(例如,我的域是 website.com。如果域不是 website.com,它将重定向到 website.com。)

我认为这将帮助我对抗 Httrack 或其他网络复印机。如果我的文件在他们的网站上,这将重定向他们的网址。

预先感谢。

0 投票
1 回答
568 浏览

web - 使用 HTTrack 仅在某个子域下下载链接(没有外部)

所以,这就是我要下载的 - https://www.slader.com/textbook/9781337624183-calculus-9th-edition/

看起来相当简单,我尝试在“扫描规则”中添加几行以强制它下载其下的所有内容,但由于某种原因,整个过程在 10 秒内完成,并且仅下载上述链接本身并没有更进一步。例如,除了拥有https://www.slader.com/textbook/9781337624183-calculus-9th-edition/本身之外,我还希望拥有源自它的所有链接,例如https://www.slader。 com/textbook/9781337624183-calculus-9th-edition/311/也。本质上,从上面的第一个链接开始的所有内容(包括来自其他域的嵌入图片,但没有外部链接。据我所知,调整一些设置并在“扫描规则”部分添加一些规则应该可以做到诡计,但不幸的是我自己无法弄清楚。