昨天是周末,网吧上网的人比较多,接近饱合状态,可偏偏就是在这关键时刻,有一台服务器出了问题...... 先是有机器开机进不了系统、正在上机的无故重起,看服务器发现,CPU利用率增高,一度达到90%以上、系统平均负载也在不断加大;Nxp Restart 无果后,果断重起服务器
服务器顺利重起完成,打开elsview竟没流量,肯定是哪里出问题了,不然100台机器都在重起中,不可能没流量的,果然,打开数据管理器的时候报错了(具体什么也记不清了),不过配置文件路径都对,不像以前遇到的配置路径丢失,设置好后就可以了,于是打开文件系统,找到MNT目录,发现MNT点不开了,提示损坏;问题有点严重了!写盘是挂到这里的,一定是写盘出问题了,没时间犹豫卸载、重组Raid吧,可卸载时就会提示正忙,下面客机都在不断的开机,容不得你操作;拔掉网线后Nxp Restart重起了仍无法卸载,看来又要重起了,重起后卸载、重组、格式化、挂载,数据管理器---系统重新添加、设置缓存,一切OK,elsview有流量了,客机也能正常开机了,告一段落!
本以为到此就结束了,接下来的差不多近半小时的时间还算正常,慢慢的CPU利用率又上去了,系统平均负载一路攀升,几分钟的功夫到了15,完了!看来回写盘出大问题了,没办法,测速看看吧,出问题的只能先不用它了,只用好的那块回写了,果然,其中一块SAS测速的时候直接卡住,Kill结束才关掉界面,接下来又是重起、卸载、格式化、挂载、数据管理器---系统重新添加、设置缓存(不过这次只挂了一块SAS),操作完后一切OK!
今天一大早,想看下是哪块盘出问题,拆下来再买上块,无论是拔掉哪块SAS,Linux都会罢工,看来要动这盘系统要重做才行,算了吧没那么多时间,重做等放假再说吧;保持原样开机,测硬盘两块SAS又都正常了,看来是我重新拔插的结果,接下来又是那些卸载、重组、格式化、挂载,数据管理器---系统重新添加、设置缓存,这次是组了Raid的,两块盘又用上了,看看一会人多时候还会出问题不,使用、关注中......
转自凡人大哥!
|
|