Record

机会是留给有准备的人

cpu使用率低但load高

起因

这个其实是去年已经解决的问题,去年系统会经常出现异常,访问不了之类的
工作日运维在的时候,运维每次都很快的解决,但问其原因,却说使用了运维大法“重启系统”,
由于一时没去解决,特别是到周末出现这个问题,就要崩溃啊。运维找不到人,自己有在外。
所以还是痛下决心研究一番是什么原因。

分析

其实用top就发现问题了。cpu使用率低,load高,然后用此关键词查找一番,发现阿里云已经有排查方案了,
依照此方案,发现是du 看磁盘空间的时候,出现了D进程。出现大量D进程,其实就是定时跑监控脚本时出现这个

解决办法

  1. 停的监控脚本
  2. 重启系统