找回密码
 加入网盟
分割线
官方精品推荐
从网维大师无盘2150开始,大家可能注意到一个问题,以往出入网吧可能会在某一排机器中间看到一台机器蓝屏在那里没有人管,而使用网维无盘2150以后的版本这种情况基本上见不到了,但死机的情况却越来越严重。以前是天天喊着蓝屏,而现在是定屏、死机。为什么?这也是今天给大家分享的一个重要话题。
【为什么死机越来越多,蓝屏却很少见了】在讨论这个问题之前,我不得不说一下网维大师在这上面耗费的苦心。
因无盘环境下一旦出现蓝屏,以前的处理方式无非是猜、看蓝屏代码继续猜。可能跟什么有关系。然后各种排除发进行测试。这样带来的问题是相当耗费技术人员的时间和精力,而且如果是因为一些系统驱动问题导致的蓝屏还会怪罪到网维无盘的软件头上。所以呢,网维无盘团队为了快速高效的定位到这些蓝屏的问题,开发了一个功能叫做“蓝屏自动捕获dump到无盘服务器”,原理便是当客户机出现蓝屏时,拦截蓝屏的消息转储一个64KB的MiniDump文件,并通过网络传送至无盘服务器。虽然客户机因为某个功能导致蓝屏,但网络模块只要不出故障,操作系统内核一样是允许使用网络进行一些操作的。也就是说你看到的蓝屏只不过是一个界面,后台真正还在运行着整个操作系统的核心。但当因为网络模块引起的蓝屏(如网卡驱动不严谨)会怎么样呢?答案便是这段主题“由蓝屏变死机”,因为网络模块出现故障,无盘核心驱动无法再通过网络将dump文件上传至无盘服务器,这样导致的现象就是死机,没错,一直卡在那里。。。
【为什么一说死机技术就让删温控、删ARP驱动】网维技术人员给出这些处理方案是有理由的,但并不严谨!
因为温度监控的确会导致客户机网络断开从而导致客户机蓝屏等情况,本人在长沙亲自处理过一个有盘环境AMD x4 740 CPU使用网维大师温度监控功能导致客户机网络连接随机性的断开的情况,最后去掉温度监控的cpuidsdk.dll后再也没有出现过网络连接变红叉的情况。庆幸的他是有盘,而如果是无盘那么死机是肯定的了。
ARP驱动与网络密切相关,网络每一个数据包都会经过ARP驱动,这样以实现精确的智能流控和防止ARP欺骗和发送欺骗包的情况出现。所以,一旦ARP驱动因为某处设计或代码缺陷,会导致致命的蓝屏,在我们看到的就是死机了。也因很难获取这种蓝屏的dump让ARP驱动的开发人员很难去修正。
而我又为什么说网维技术人员给出的这些处理方案不够严谨呢?其实导致死机的原因刚才我们已经说过了,99%是因为系统因为网络方面的故障而蓝屏无法上传dump出现死机。但并不一定全部与ARP驱动和温度监控这两个模块有关。说句不好听的就是在瞎猫碰死耗子。碰上了就碰上了,碰不上就没辙了。
【对于这种无解的死机问题要如何处理】如果你是一位合格的技术人员,你对自己和网吧业主或你的老板负责,那么请你往下看,如果你是一位 懒惰不堪、不会思考 的技术人员那对不起,浪费你的时间请关闭本网页。
1、关闭无盘抓取蓝屏dump功能。
关闭无盘抓取蓝屏dump功能非常简单,只要将所有客户机的附DNS设置为127.1.0.32即可。抓取蓝屏dump的功能自然会不生效。这样是为了方便我们通过自己的方法捕获FullDump。

2、在系统中设定蓝屏不自动重启并转储核心dump
客户机开启超级用户,在系统属性各种,将出现故障自动重启的勾去掉,并设置出现故障时将转储核心完整的dump。如下图:

3、使用PCI转1394火线卡抓取核心完整蓝屏dump文件
根据该文章,部署环境抓取蓝屏dump http://www.clxp.net.cn/article/2082.html
4、自己分析或上传到网盘在本站留言我们会帮你分析具体原因
如果你具备自己分析蓝屏dump的能力,那么相信你一定可以自己搞定这些问题。如果你并不懂,可以将dump文件上传到网盘中,然后将网盘的地址在本站留言让我们帮你分析。

转载自死性不改博客
分享至 : QQ空间
收藏

2 个回复

倒序浏览
mdlkfc007 8 2014-10-25 00:14:19
2#
好贴 学习了 必须顶
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入网盟
关闭

华夏网盟推荐 上一条 /1 下一条