mysql 复制故障处理中 global sql_slave_skip_counter 参数的误区

在主从库维护中,有时候需要跳过某个无法执行的命令,需要在slave处于stop状态下,执行 set global sqlslaveskip_counter=N以跳过命令。常用的且不易用错的是N=1的情况,但N>1时,则不那么顾名思义,本文详细介绍N的意义,及使用注意事项。

MySQL从库从主库上复制binlog文件内容到本地执行。在binlog上命令以event的形式存在,并非一个命令对应一个event。以一个insert语句为例(引擎InnoDB、binglogformat=statement), 在binlog中实际上有三个event,分别为begin\insert\commit 。 命令类型都是Querylog_event.

而set global sqlslaveskip_counter=N的意思,即为在start slave时,从当前位置起,跳过N个event。每跳过一个event,则N--.

与实际情况不符? 看到这里有同学就会问,这是有问题的。如果当前的执行位置是某个insert语句开头,那使用 N=1实际上是从begin\insert\commit的第二个开始执行,这个insert语句还是不能被跳过? 实际上这里还有两个策略: 1、若N=1且当前event为BEGIN, 则N不变,跳过当前event继续。 2、若N=1且当前event处于一个事务之内(BEGIN之后,COMMIT之前),则N不变,跳过当前event继续。

说明:其实上面两个策略合起来就是一句话,当N=1时,会连续跳过若干个event,直到当前所在的事务结束。 当然如果N>1,则每跳过一个event都要N--.

命令举例: 所以我们平时最常用的N=1的情况,都是下一个事务。 假设某个Pos之后执行如下命令( 引擎InnoDB、binglog_format=statement), insert into t values(x1); begin; insert into t values(x2); insert into t values(x3); commit; insert into t values(x4); 你的从库stop在Pos上,假设你要跳过前面几个命令直接执行插入x4的操作,则你的N设置为 4或5或6或7均可。(X1语句为3个event)

上面举例中都特别说明了在innodb引擎和statement模式下。其他情况区别如下: 1、若引擎为myisam(等不支持事务的引擎),且在statement下,则binlog中不会有begin和commit,每个命令都是一个event; 2、row模式的binlog里,一个insert语句实际上是两个event(Tablemapevent和 Rowlogevent), 计算时应与statement不同。 3、在row模式下,不论引擎是否支持事务,一个insert语句都会加上BEGIN和commit,也即变成4个event。 4、基于InnoDB引擎表的insert/delete/update操作都有显式样的BEGIN /COMMIT.

上面举的这个例子中,若为row模式,则要直接执行X4语句需要设置的N为 5~10均可。

小结: 1、set global sqlslaveskip_counter=N中的N是指跳过N个event 2、最好记的是N被设置为1时,效果跳过下一个事务。 3、跳过第N个event后,位置若刚好落在一个事务内部,则会跳过这整个事务 4、一个insert/update/delete不一定只对应一个event,由引擎和日志格式决定

参考:1.