【故障公告】阿里云 RDS 数据库突发 CPU 近 100% 引起全站故障

今天晚上9点咱们收到阿里云的告警通知:html

【阿里云监控】华东1(杭州)-云数据库RDS版<cnblogsdb> [instanceId=xxx] 于21:00 发生告警, 前往诊断 CPU使用率平均值(98.25>=80 ), 持续时间4分钟, rds_CpuUsage数据库

收到通知后,咱们当即登陆阿里云 RDS 控制台进行主备库切换,等主备库完成切换后一看并无切换过来,赶忙再次进行切换,第2次切换成功了,切换完成后 CPU 马上降至正常水平,全站恢复正常。post

此次故障发生时间是8月20日20:55~21:14,由此给您带来麻烦,请您谅解。优化

上次发生一样故障是6月24日,详见 【故障公告】阿里云 RDS 实例 CPU 100% 故障引起全站没法正常访问阿里云

阿里云数据库专家分析后怀疑是“LINQ 生成的 SQL 存在问题,致使几率性 SQL Server 出现参数嗅探问题”。url

咱们会进一步分析并优化此次引起参数嗅探问题的 SQL 语句。3d