Mysql数据库复制延时分析
2012-07-21 15:35:15 来源:我爱运维网 评论:0 点击:
现象:Mysql主从复制,出现延时报警。排查分析:延迟期间mysql备库执行次数从10000降到了1。从库在3:10-4:10之间基本没有执行什么sql, bin...
现象:Mysql主从复制,出现延时报警。
排查分析:
延迟期间mysql备库执行次数从10000降到了1。
排查分析:
延迟期间mysql备库执行次数从10000降到了1。
从库在3:10-4:10之间基本没有执行什么sql, binlog为010177:
-rw-rw---- 1 mysql mysql 134218050 Jul 18 04:17 mysql-bin.010178
-rw-rw---- 1 mysql mysql 134217813 Jul 18 04:15 mysql-bin.010177
-rw-rw---- 1 mysql mysql 134218004 Jul 18 03:05 mysql-bin.010176
Dump binlog并且分析,排除exec_time=[0-9](基本不延迟的sql):
grep exec_time binlog_010177.txt|egrep -v "exec_time=[0-9]\s" |more
#120718 3:05:11 server id 41 end_log_pos 4204919 Query thread_id=72265543 exec_time=4294967295 error_code=0
….
#120718 3:09:58 server id 41 end_log_pos 49897358 Query thread_id=72059376 exec_time=4294967295 error_code=0
#120718 3:10:01 server id 41 end_log_pos 51693592 Query thread_id=72265543 exec_time=3863 error_code=0 =>突然出现延迟
#120718 3:10:01 server id 41 end_log_pos 51693804 Query thread_id=72265543 exec_time=3863 error_code=0
#120718 3:10:01 server id 41 end_log_pos 51693904 Query thread_id=72273535 exec_time=3863 error_code=0
#120718 3:10:01 server id 41 end_log_pos 51694116 Query thread_id=72273535 exec_time=3863 error_code=0
Mysql有大量读操作:
Data_W Data_R Log_W D_fync L_fync Curr_Lock Lock_tim PageData PageFree PageFlush DiskRead Dblwr_w PageRe PageWri
07-18 03:09:23 274 0 251 13 11 0 0 19094M 3M 42 0 1 0 21
07-18 03:09:33 454 0 228 20 12 0 0 19094M 3M 440 0 3 0 220
07-18 03:09:43 470 0 244 27 12 0 0 19094M 3M 440 0 3 0 220
07-18 03:09:53 461 0 234 19 11 0 0 19094M 3M 442 0 3 0 221
07-18 03:10:03 5346 263 5119 22 11 0 0 19098M 0M 442 136 3 238 221
07-18 03:10:13 22 10654 0 4 1 0 0 19098M 0M 40 2234 1 10679 20
07-18 03:10:23 23 4197 1 4 2 0 0 19098M 0M 40 2631 1 4197 20
07-18 03:10:33 545 8461 0 26 4 0 0 19098M 0M 1060 1231 6 8461 530
07-18 03:10:43 0 12734 0 0 0 0 0 19098M 0M 0 1 0 12734 0
07-18 03:10:53 0 11204 0 0 0 0 0 19098M 0M 0 72 0 11204 0
07-18 03:11:03 0 12151 0 0 0 0 0 19098M 0M 0 980 0 12151 0
07-18 03:11:13 0 11876 0 0 0 0 0 19098M 0M 0 311 0 11876 0
07-18 03:11:23 0 0 0 0 0 0 0 19098M 0M 0 0 0 0 0
磁盘IO那段时间很高:
机器文件缓存出现过突然的释放:
详细分析:
1. 肯定是有某个大的操作,导致缓存被flush
2. Slow query log可以看到大量的全表nocache读
3. 突然延迟说明之前的恢复操作是被锁住,而不是执行缓慢
4. 怀疑是备份程序导致,可以从时间上验证是吻合的
[root@MYSQLDB2]# ls -altd /home/mysql/backup/DB2/3306
drwxrwxr-x 3 mysql mysql 4096 Jul 18 03:10 /home/mysql/backup/DB2/3306
5. 为何会锁: 数据库还是有很多表是myisam引擎,innobackup会上锁, 之前的备份都出现过同样的问题:
mysql> select TABLE_SCHEMA,count(*) from tables where engine='MyISAM' and table_schema!='mysql' group by table_schema;
+--------------------+----------+
| TABLE_SCHEMA | count(*) |
+--------------------+----------+
| gongyuan | 2 |
| information_schema | 9 |
| 5iops_ad | 23 |
| 5iops_comment_log | 379 |
| srv_gongyuan | 15 |
| 5iops_upload | 1 |
+--------------------+----------+
6 rows in set (0.20 sec)
Todo:
1. 全网检查myisam引擎的表
2. 发现long_query_time还是有机器没有设置,需要全网检查
上一篇:Redis问题:主从maxmemory策略配置不当会致死循环
下一篇:使用jmx client监控activemq
分享到:
收藏
评论排行
- ·Windows(Win7)下用Xming...(92)
- ·使用jmx client监控activemq(20)
- ·Hive查询OOM分析(14)
- ·复杂网络架构导致的诡异...(8)
- ·使用 OpenStack 实现云...(7)
- ·影响Java EE性能的十大问题(6)
- ·云计算平台管理的三大利...(6)
- ·Mysql数据库复制延时分析(5)
- ·OpenStack Nova开发与测...(4)
- ·LTPP一键安装包1.2 发布(4)
- ·Linux下系统或服务排障的...(4)
- ·PHP发布5.4.4 和 5.3.1...(4)
- ·RSYSLOG搭建集中日志管理服务(4)
- ·转换程序源码的编码格式[...(3)
- ·Linux 的木马程式 Wirenet 出现(3)
- ·Nginx 发布1.2.1稳定版...(3)
- ·zend framework文件读取漏洞分析(3)
- ·Percona Playback 0.3 development release(3)
- ·运维业务与CMDB集成关系一例(3)
- ·应该知道的Linux技巧(3)