8

我们正在关闭对话网络(包括IT 对话播客)。计划是呈现我们网站的静态 HTML 版本,以便永久托管在Internet Archive中。

从目前从 PHP 动态生成的大约 5,000 个动态页面生成静态 HTML 的最简单方法是什么?

我知道我们可以调整代码以缓存 PHP 输出,将其写入文件,然后遍历站点地图以生成每个页面。但我想知道是否有任何我们应该考虑的选择。有什么工具可以做到这一点并按原样抓取 HTML?(Acrobat Pro 以外的其他软件?)

不幸的是,我们还有相当多的 Ajax 调用,这将使这变得更加困难。我想我们必须先取消 Ajax。

4

2 回答 2

5

它可能不是您想要的;但HTTrack会浏览您的网站以获取链接并保存它的 HTML 版本。此镜像将包含所有链接的静态内容,例如图像、css 和 javascript。

我能想到的唯一问题是您的 AJAX 脚本是否从服务器中提取重要数据,但也许 HTTrack 有一个设置。

于 2012-09-26T20:41:57.997 回答
2

有一个很棒的软件叫做“ Teleport Pro ”(不幸的是付费软件),它可以创建网站的可浏览/复制副本。哪个,一旦上传到服务器,应该与原始站点完全相同。

从动态页面创建静态 html 时要记住的事情是:

  • 您当前的 ajax 调用需要取消 ajaxed(正如您自己所说)
  • .htaccess 设置,例如 mod_rewrite 可以使您的静态文件一文不值。因为链接可能不起作用。

但是“Teleport pro”是一个真正可靠的程序,已经存在了很长一段时间。我过去使用过它,并且可能会再次使用它。


另一种方法可能是创建缓存的 php 模块“php-apc”。在这种情况下,您需要在创建完整的缓存之前抓取整个站点。我不太熟悉它,但是安装很容易,您可以查看生成的文件是否有用。

于 2012-09-26T19:53:47.120 回答