Cisco CRS-MSC-X板卡维修案例   思科板卡IOS XR FAILURE启动失败 维修案例
	
		 
	
		        主题:CRS无法启动
	
		        CRS-MSC-X启动报错
		 
	
		使用命令 show platform 查看
	
		RP/0/RP1/CPu0:ios(admin)#
	
		RP/0/RP1/CPu0:ios(admin)#sh platform
	
		Node  Type  PLIM   State     Config state         
		------------------------------------------------------------------------------------------------
		0/2/CPU0    MSC-X    N/A      MBI-BOOTING        PWR ,NSHUT ,MON
	
		0/RP1/CPU0  RP(Active)  N/A      IOS XR RUN         PWR ,NSHUT ,MON
	
		0/FC1/SP     FAN-CT(SP)  N/A        IOS XR RUN          PWR ,NSHUT ,MON
	
		0/AM1/SP    ALARM-B(SP)  N/A        IOS XR RUN         PWR ,NSHUT ,MON 
	
		0/SM0/SP   FC-400G/S(SP)  N/A        IOS XR RUN          PWR ,NSHUT ,MON 
	
		RP/0/RP1/CPU0:ios(admin)#
	
		RP/0/RP1/cpu0:ios(admin)#sh platform    pRp/0/Rp1/cpu0:mar 10 23:58:17.583 : shelfmgrV2[388]: %PLATFORM-SHELFMGRV2-3-NODE_HBLOSS_RESET : Reset node 0/2/cpl0 due to heartbeat loss  
	
		 
	
		RP/0/RP1/CPU0:ios(admin)#sh platferm
	
		Node  Type  PLIM   State     Config state         
		------------------------------------------------------------------------------------------------
		0/2/CPU0    MSC-x    N/A      IOS XR FAILURE        PWR ,NSHUT ,MON
	
		0/RP1/CPU0  RP(Active)  N/A      IOS XR RUN           PWR ,NSHUT ,MON
	
		0/FC1/SP     FAN-CT(SP)  N/A        IOS XR RUN            PWR ,NSHUT ,MON
	
		0/AM1/SP    ALARM-B(SP)  N/A        IOS XR RUN           PWR ,NSHUT ,MON 
	
		0/SM0/SP   FC-400G/S(SP)  N/A        IOS XR RUN           PWR ,NSHUT ,MON 
	
		 
	
		RP/0/RP1/CPU0:ios(admin)#
	
		RP/0/RP1/CPU0:ios(admin)#RP/0/RP1/CPU0:               Mar 10 23:59:11.736 : shelfmgrv2[388]: %PLATFORM-SHELFMGRV2-3-FAILURE : DCDC enable failure 0xafea0a0'subsystem(8148)'detected the 'fatal' condition 'Code(5)'
		 
	
		        一,故障判定
	
		        CRS-MSC-X启动报错, MBI-BOOTING 与CRS IOS XR FAILURE显示状态最终报错代码, DCDC enable failure 0xafea0a0'subsystem(8148)'detected the 'fatal' condition 'Code(5)',根据报错信息提示判定为DC供电模块故障。
	
	
		        二,故障测量
	
		        MSC-X板卡DC供电模块输入端电压正常并且稳定,但输出端电压存在波动,导致MSC-X板卡IOS XR FAILURE启动失败,无法启动到XR-Run 状态。测量结果发现其中一组BGA芯片DC供电转换模块处于损坏状态。更换好供电转换模块插入CRS-16-LCC机箱出现新的报错。
		 
	
		RP/0/RP1/CPU0:ios(admin)#sh platform
	
		Node  Type  PLIM   State     Config state         
		------------------------------------------------------------------------------------------------
		0/2/*        MSC-x    N/A      PRESENT          PWR ,NSHUT ,MON
	
		0/RP1/CPU0  RP(Active)  N/A      IOS XR RUN         PWR ,NSHUT ,MON
	
		0/FC1/SP     FAN-CT(SP)  N/A        IOS XR RUN          PWR ,NSHUT ,MON
	
		0/AM1/SP    ALARM-B(SP)  N/A        IOS XR RUN         PWR ,NSHUT ,MON 
	
		0/SM0/SP   FC-400G/S(SP)  N/A        IOS XR RUN          PWR ,NSHUT ,MON 
	
		RP/0/RP1/CPU0:ios(admin)#
	
		RP/0/RP1/CPu0:ios(admin)#RP/0/RP1/CPU0:      Mar 10 23:46:55.003 : shelfmgrV2[388]:%PLATFORM-SHELFMGRV2-3-INVALID_SLOTID_IN_BOOTREQ: A boot requestsent to shelfmgr on rack 0 (rack type 0) is ignored as it contains invalid slotId 45 with card type 400G Engine modular switch card (0x50006c).Possible seating issue, please reseat the suspected card(s).
	
		 
	
		        三,BGA更换:
	
		        CRS启动失败,通电测量CRS-MSC-X各项电压输出正常,根据报错信息提示为无法正确识别400G模块。测量发现主板BGA芯片接口数据信号总线阻值异常,因此判断总线芯片损坏,这里要用到专业的BGA焊接台进行更换。BGA芯片更换必须要先了解芯片尺寸和焊点布局,选择合适的锡球,调整适当的温度设定足够的时间,以避免BGA芯片更换时过热或者过焊导致损坏。
	
	
		        BGA芯片更换后仪器测量各部件显示全部正常,安装好设备底壳配件等,CRS-MSC-X成功启动到 IOS XR 运行正常。如下图:
	
	
		 
	
		
0/2/CPu0  MSC-X  40-10GbE  IOS XR RUN PWR.NSHUT.MON
		 
 
	
		        维修完成后,网度通信工程师再次测试机器所有功能是否正常,如正常便清洁机器内外部灰尘污渍后进行烤机,烤机2天后再次进行全面检查无故障问题后再交付给客户。
	
		
NODE 0/2/CPU 0 Node state : IOS XR RUN
 
	
		        我们每次维修都会记录相关故障信息数据和维修记录到数据库,网度通信多年来积累了CISCO、Juniper、Brocade、H3C、F5、华为、IBM、HP、EMC等多品牌:路由器维修、交换机维修、各类板卡引擎维修、负载均衡维修、防火墙维修、服务器维修、存储维修等各类ICT设备故障维修数据,维修技术经验成熟,现综合维修成功率达90%以上。
	
		 
	
		        服务价值优势:
	
		        1、以较低成本修复高价值设备,可提高硬件资源利用率,降低企业采购成本;
	
		        2、及时快速的设备维修服务,保障业务系统可用性,提高业务系统稳定性,
	
		        3、维修期间还可提供备机备件,结合网度快速备件供应服务使停机时间更短,减少企业运营风险,解除客户长时间系统宕机之忧。  
	
		        选择网度通信可以更加快捷为您解决问题,为您的业务系统硬件设备稳定高效运行提供一份安全保障。