我刚开始在一个非常标准的带有 mysql 数据库的 Spring 2.5 Web 应用程序中使用 flyway。它已经投入生产多年,拥有大量数据。
我将它连接到启动时自动迁移
<bean id="flyway" class="com.googlecode.flyway.core.Flyway" init-method="migrate">
<property name="dataSource" ref="dataSource"/>
</bean>
并且使 Spring 的持久性单元管理器(使用 jpa)依赖于它,因此数据库将在 JPA 初始化之前被迁移。
这工作正常。
在我们的生产环境中,我们有几个我们希望同时更新的节点。因此,如果每个实例长时间运行,它们将尝试执行相同的迁移。Flyway 的锁定功能应该可以防止这种情况。
我喜欢在生产中做任何事情之前测试这些东西,所以我做了;当两个应用程序实例同时启动并长时间运行迁移(6 分钟)时发生的情况是,过了一会儿,第二个实例失败了:
Caused by: com.googlecode.flyway.core.exception.FlywayException: Unable to lock metadata table 'schema_version' in schema 'dbschema'
at com.googlecode.flyway.core.metadatatable.MetaDataTable.lock(MetaDataTable.java:148)
at com.googlecode.flyway.core.migration.DbMigrator$1.doInTransaction(DbMigrator.java:116)
at com.googlecode.flyway.core.migration.DbMigrator$1.doInTransaction(DbMigrator.java:114)
at com.googlecode.flyway.core.util.jdbc.TransactionTemplate.execute(TransactionTemplate.java:54)
at com.googlecode.flyway.core.migration.DbMigrator.migrate(DbMigrator.java:113)
...
堆栈跟踪的更深处是 SQLException:
Caused by: java.sql.SQLException: Lock wait timeout exceeded; try restarting transaction
at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1055)
at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:956)
...
本质上它似乎超时。
我们正在使用 mysql 和 afaik 它试图锁定元数据表
select * from dbschema.schema_version for update
我检查了它试图迁移的数据库及其锁定等待超时:
mysql> show variables like 'innodb_lock_wait_timeout';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| innodb_lock_wait_timeout | 120 |
+--------------------------+-------+
这是明显的罪魁祸首。但是,我不确定是否要增加数量,因为如果由于其他原因发生这种情况,我可能希望它超时。
我可能会尝试在迁移期间将其设置为更高的值。除了它似乎是一个只读变量:
SET innodb_lock_wait_timeout = 240;
ERROR 1238 (HY000): Variable 'innodb_lock_wait_timeout' is a read only variable
如果我知道会有长时间运行的迁移,我当然可以半手动地进行部署,例如只更新一个实例并等待它通过迁移,然后更新其他实例。
有没有人有任何其他建议?