11

有谁知道任何允许比较两个几乎完全相同的网站的工具?

简单地说,我有一个沙盒站点和一个生产站点,并且想找出它们之间的区别,以了解将哪些内容移动到生产站点。

谢谢!

编辑:

好的,我看到我错过了一条重要信息(抱歉!)。这两个站点都是在线的并且基于 CMS (Drupal),因此我需要一些可以在这两个站点上运行的爬虫工具,并显示沙盒中存在哪些页面,而不是生产中的页面。

感谢所有回答的人!

4

10 回答 10

10

使用httrack下载站点的副本,然后使用您喜欢的文件比较工具来查看差异。(我更喜欢WinMerge,它可以通过两个文件文件夹递归运行,具有忽略空格差异和空行的选项,甚至使用 WINE 在 Linux 下运行良好。)

PS 您甚至可能希望在进行比较之前通过HTML Tidy运行下载的 HTML 文件以规范化/漂亮地格式化它们。


另一种方法是进行数据库比较。不过,您仍然可以对原始网站文件(不是蜘蛛版本)进行文件比较。从记忆来看,Drupal 数据库的模式并不难理解,特别是如果您主要对节点内容感兴趣。

于 2009-04-02T20:59:52.520 回答
8

超越比较......纯粹的敬畏

于 2009-04-01T19:58:25.960 回答
4

WinMerge是一个免费/开源工具,允许您比较文件和目录。

您可以显示相同、不同或仅存在于一个目录中的文件。然后,您可以通过将文件从一个目录复制到另一个目录来使两个目录相同。

于 2009-04-01T19:57:57.897 回答
3

正如 Sunny 所说,使用爬虫和 diff 工具。

对于爬虫,我更喜欢 httrack 而不是 wget。如今,许多网站都使用从 css 引用的图像。当我上次检查时,wget 无法加载从 css 引用的文件。除此之外,它还有一个不错的 GUI。

从 diff 工具开始:我从 Windows 3.1 开始就使用 FileSync。当然还有更多花哨的 diff 工具,但这个工具简洁干净,可以胜任。在 unix 上,您始终可以执行 diff -r。如果你的机器上有 Eclipse,它有一个很好的差异查看器,它也可以比较两个目录。

于 2009-04-02T18:31:09.757 回答
1

如果您正在运行 Linux, Meld对此很有用。它在 Debian/Ubuntu 存储库中可用。

于 2009-04-01T22:04:57.917 回答
1

使用wget抓取网站,用一些差异工具比较内容。

或者,对脚本文件使用 diff 工具,然后将 DB 转储到文本 (csv) 文件中,然后进行比较。

于 2009-04-02T17:34:39.910 回答
0

超越比较是伟大的。Syncback ( http://www.2brightsparks.com/downloads.html ) 有一个免费版本,您可以使用任何合并工具,如 araxis 或 winmerge

于 2009-04-01T20:00:42.210 回答
0

将您的代码放入Subversion或其他一些源代码控制中。当准备好部署时,' svn update ' 将只更新已更改的内容。

' svn diff ' 将显示差异。

于 2009-04-01T20:03:34.730 回答
0

DiffMerge是另一个支持目录差异的免费跨平台工具。

于 2009-04-01T20:07:25.453 回答
0

您还可以使用一些在线比较服务,例如CopyScapeChangeDetection

于 2017-06-19T17:08:13.440 回答