不要低估这种迁移的复杂性。
对于 100GB,可以很好地猜测您的表中的大多数行都不会被更新或删除。
为了让我的建议起作用,您需要一种方法
SELECT * FROM table WHERE (the rows are new or updated since a certain date)
一些仅 INSERT 表将具有自动递增的 ID 值。在这种情况下,您可以计算出新旧之间的 ID 截止值。其他表可能已更新。除非这些表有时间戳说明它们何时更新,否则您将很难弄清楚。您需要了解您的数据才能做到这一点。如果您的WHERE (new or updated)
操作需要一些较旧的额外行,那也没关系。如果它错过了 INSERTed 或 UPDATEd 行,那就不行了。
一旦您知道如何为每个大表执行此操作,您就可以开始迁移了。
大规模迁移保持旧系统在线并处于活动状态,您可以使用它mysqldump
来将数据迁移到新服务器。只要您需要,您就可以完成它。阅读本文以获取一些建议。即使使用 max_allowed_packet 参数,在使用 mysqldump 时也会丢失与 mysql 的连接
然后,您将在新服务器上拥有数据的陈旧副本。确保正确构建索引。您可能希望OPTIMIZE TABLE
在新加载的表上使用。
更新迁移然后,您可以使用WHERE (the rows are new or updated)
查询来迁移自迁移整个表以来已更改的行。同样,您可以根据需要执行此操作,同时保持旧系统在线。它应该比您的第一次迁移花费更少的时间,因为它将处理更少的行。
最终迁移,脱机最后,您可以使系统脱机并迁移剩余的行,即自上次迁移以来更改的行。并再次完全迁移您的小表。然后启动你的新系统。
是的,但是,你说,我怎么知道我做对了?
为获得最佳结果,您应该编写迁移步骤的脚本,并使用这些脚本。这样,您的最后迁移步骤将很快进行。
您可以在本地服务器上排练此过程。虽然 100GiB 对于数据库来说很大,但在台式机或服务器机房机器上的磁盘空间量并不算大。
保存从大规模迁移步骤中提取的非常大的文件,以便在第一次尝试加载它们时重新使用它们。这样,您将节省旧系统上的重复提取负载。
您应该(在您的新云提供商处)建立已迁移数据库的暂存副本,并使用应用程序的暂存副本对其进行测试。您可以使用一小部分行来执行此操作。但是请务必使用此副本测试您的最终迁移步骤,以确保它有效。
如果新系统出错,请做好快速回滚到旧系统的准备。
而且,也许这是在迁移之前清除一些旧数据的机会。这种迁移非常困难,您可以在开始迁移之前制定一个从旧服务器中提取然后删除旧行的业务案例。