第14问:在 MGR 集群里,一个节点异常退出后,会发生什么?

发布时间:2020-07-03 浏览次数:211

问题

在一个 MGR 集群里,一个节点异常退出后,MySQL 会如何进行调度?异常的节点什么时候会被踢出集群?



实验

实验开始前,给大家分享一个小经验:选择合适的观测工具,如果没有,就创造一个。

我们先使用三台虚拟机,创建一个 MGR 的集群。MySQL 的版本是 5.7.20(之所以使用低版本的 MySQL,因为恐怕没有人能说清楚这个低版本的 MGR 的行为,不能扯淡只能观测)。

这次我们忽略这一操作步骤,只看一下创建好的集群:

检查一下谁是 Primary:

现在我们得选择一个观测工具了。我们知道 MGR 需要通过网络来相互沟通,对集群内的节点状况达成一致。通过抓包对 MGR 的行为进行分析,看上去是个不错的主意。

不过 Wireshark 并不支持分析 MGR 的网络协议,我们只能自己创造一个 Wireshark 的分析插件(dissector)。

此处我们忽略创造插件的过程,直接拿来用就可以了。

我们访问:

https://github.com/actiontech/wireshark-dissector-mysql-group-replicaiton/releases

下载 Wireshark 的安装包,并安装好:

我们在 MGR 的 Primary 节点(test-mgr-1)上抓包:

然后将一个节点(test-mgr-3)干掉:

我们用刚安装的 Wireshark 打开抓包的文件 test-mgr-1.cap,并使用 MGR 协议解开抓包:

效果如图:

我们现在为 Wireshark 的列表增加一列,将 MGR 的信息类型显示出来:

这一列的公式为:mgr.app_data.body.cargo_type

这样我们就能看到 MGR 的信息类型:

现在我们通过过滤公式,找到特定类型的 MGR 信息:

可以看到 MGR 的 Primary(10.186.61.45,也就是 test-mgr-1)向另一个存活节点(10.186.61.71,也就是 test-mgr-2)发送了三个信息,分别是 view_msg,remove_node_type,view_msg。我们仔细看看这三个包的详细信息:

第一个包,是 Primary 发出的 view 信息(view 是 MGR 的各个节点的状态),可以看到这个 view 的信息是:第一个节点在线,第二个节点在线,第三个节点离线。

第二个包是删除节点的通知,Primary 通知其他节点,将删除离线的节点三。

第三个包是一秒之后发送的,Primary 通知其他节点新的 view 是什么样的:新的 view 只有两个节点了。

通过抓包,我们看到了 MGR 各个节点间的信息交换,借此理解 MGR 节点间的调度行为。

在一个节点崩溃后,Primary 节点很快就向全员更新了某节点离线的信息。然后将其踢出集群,并将决定通知全员。

希望我们创造的这个 Wireshark 插件,可以帮助大家理解 MGR 的调度行为,也欢迎大家提需求或缺陷。



上一篇: 技术分享 | MySQL 的嵌套事务、自治事务与链式事务

下一篇: 新特性解读 | mysql 8.0 memcached api 新特性

咨询客服 在线咨询
400-820-6580 免费电话