◆◆0怎么排查Tair/Redis 全链路的问题? 黛云轩 2022/01/09 云圈子 323 1 百度已收录 阿里云双十二 新老用户服务器仅需57元起 双十二低至1折 1核2G 云服务器390元/1年 学生用户专属 18-24岁用户直享¥9.5/月 云·速成美站 千套模板,自己动手建网站 企业用户优选 2核8G内存5M带宽1015元/3年 多产品一键采购 购物车采购可减5000元 云服务器全球购 海外1核2G服务器低至2折 腾讯云双十一 2核4G 3M 698元/3年 过期域名预定 过期域名快速查询和抢注服务 ECS 云服务器 SWAS 轻量应用服务器 RDS 云数据库 Redis 云数据库 CDN 内容分发 OSS 对象存储 SLB 负载均衡 NAT 网关 DNS 云解析 MAIL 企业邮箱 WAF 应用防火墙 DDoS 高防 SMS 短信包 MK 云市场 XIN 心选 IM 商标注册 JZ 自营建站怎么排查Tair/Redis 全链路的问题?上一篇: 服务端调用 URLDecoder.decode(str, "UTF-8")会抛出异常,是什么原因?下一篇: 第三方CMDB插件怎么查询实体?
全链路中每个部分都有可能会出问题,问题排查总体上包括两大部分:前段和后段。
2022-01-04 18:02前段排查首先需要确定是一台客户端出问题,还是全部有问题,如果是一台出问题,大概率是客户端自己的问题。
前段排查,包括但不限于:
一.ECS
1.Load,内存等;
2.PPS 限制
二.客户端 1.连接池满;
2.RT 高(跨地域,gc 等);
3.建连接慢(K8s DNS 等);
4.大 Range 查询,发送快,接收慢
三.网络 227
1.网络发生丢包,抖动等;
2.运营商网络抖动。 后段排查,主要是慢查询和 CPU排查,包括“ Proxy”、“DB”两个主要组件
四.Proxy
1.分发慢查询,导致 RT 升高;
2.流量和 CPU 升高(需要扩容 proxy);
五. DB
1.容量、CPU 和流量问题(见前文);
2.主机发生故障,业务侧影响和 HA 执行速度有关;
3.慢查询,可以通过慢日志看到具体的命令后段排查,主要是慢查询和 CPU 排查,包括“ Proxy”、“DB”两个主要组件:
一.Proxy
1.分发慢查询,导致 RT 升高;
2.流量和 CPU 升高(需要扩容 proxy)
二.DB
1.容量、CPU 和流量问题(见前文);
2.主机发生故障,业务侧影响和 HA 执行速度有关;
3.慢查询,可以通过慢日志看到具体的命令
资源来源于《阿里云数据库运维实战问题改》
https://developer.aliyun.com/topic/download?spm=a2c6h.20345107.J_6399686890.1.2e1e17dbzKUX5r&id=8198