{{ item.name }}
{{ item.name }}

{{ it.name }}

{{ it.text }}

{{ it.name }}

{{ innerIt.name }}

{{ innerIt.text }}

{{news.time}}
{{news.title}}
不小心对一个大表进行了 update,怎么看进度
2020-05-27发布 1,103浏览

问题

有时候我们会不小心对一个大表进行了 update,比如说写错了 where 条件......

此时,如果 kill 掉 update 线程,那回滚 undo log 需要不少时间。如果放置不管,也不知道 update 会持续多久。

那我们能知道 update 的进度么?

实验

我们先创建一个测试数据库:

不小心对一个大表进行了 update,怎么看进度-爱可生


快速创建一些数据:

不小心对一个大表进行了 update,怎么看进度-爱可生


连续执行同样的 SQL 数次,就可以快速构造千万级别的数据:

不小心对一个大表进行了 update,怎么看进度-爱可生


查看一下总的行数:

不小心对一个大表进行了 update,怎么看进度-爱可生


我们来释放一个大的 update:

不小心对一个大表进行了 update,怎么看进度-爱可生


然后另起一个 session,观察 performance_schema 中的信息:

不小心对一个大表进行了 update,怎么看进度-爱可生


可以看到,performance_schema 会列出当前 SQL 从引擎获取的行数。

等 SQL 结束后,我们看一下 update 从引擎总共获取了多少行:

不小心对一个大表进行了 update,怎么看进度-爱可生


可以看到该 update 从引擎总共获取的行数是表大小的两倍,那我们可以估算:update 的进度 = (rows_examined) / (2 * 表行数)

不小心对一个大表进行了 update,怎么看进度-爱可生


小贴士

information_schema.tables 中,提供了对表行数的估算,比起使用 select count(1) 的成本低很多,几乎可以忽略不计。

那么是不是所有的 update,从引擎中获取的行数都会是表大小的两倍呢?这个还是要分情况讨论的,上面的 SQL 更新了主键,如果只更新内容而不更新主键呢?我们来试验一下:

不小心对一个大表进行了 update,怎么看进度-爱可生


等待 update 结束,查看 row_examined,发现其刚好是表大小:

不小心对一个大表进行了 update,怎么看进度-爱可生


那我们怎么准确的这个倍数呢?

一种方法是靠经验:update 语句的 where 中会扫描多少行,是否修改主键,是否修改唯一键,以这些条件来估算系数。

另一种方法就是在同样结构的较小的表上试验一下,获取倍数。

这样,我们就能准确估算一个“不小心”执行的大型 update 的进度了。

上一篇
新特性解读 | binlog 压缩
400-820-6580 13916131869
marketing@actionsky.com
上海市闵行区万源路2138号泓茂中心2号楼
产品详情
关系型数据库
AI数据库
数据库智能管理平台
数据库生态产品
行业案例
金融行业
新零售行业
制造业
通信行业
更多
公司动态
最新新闻
国产化信息
技术分享
关于我们
公司简介
公司分布
国家专利
资质认证
扫码关注公众号
© Copyright 2017, All rights reserved by: 上海爱可生信息技术股份有限公司 沪ICP备12003970号-1 | 法律声明 | 网站地图
沪公网安备 31010402003331号