解决ThinkSystem板载显卡(Matrox MGA200)驱动致系统宕机 问题:驱动相关 故障现象: ThinkSystem服务器板载Matrox MGA200图形芯片会不定时出错,并导致系统宕机。 此问题影响目前全系列ThinkSystem服务器。 受此问题影响的操作系统包括: Windows Server 2012 R2及2016; Red Hat Enterprise Linux 6.x; Red Hat Enterprise Linux 7.x; SUSE Enterprise Linux 11.x; SUSE Enterprise Linux 12.x; CentOS及Oracle Enterprise Linux。原因分析: 当非零值写入Matrox G200e的高优先级寄存器时,会产生一个亚稳态状况,导致与PCI-E接口有关视频数据队列被阻止,然后造成PCI-E总线超时错误,并最终造成一个IERR和系统宕机。解决方案: 对于受支持的操作系统: Windows Server 2012 R2, Windows Server 2016, Red Hat Enterprise Linux 6.9, Red Hat Enterprise Linux 7.3, SUSE Enterprise Linux 11 SP4, SUSE Enterprise Linux 12 SP2, 更新板载显卡驱动即可,txt readme文档中有操作说明。 操作系统 联想(中国)官网下载页面 联想(国际)官网下载页面 Windows Server 2012 R2及2016 http://support.lenovo.com.cn/PurleyWeb/ThinkSystemDetail.html?ID=199741 http://datacentersupport.lenovo.com/downloads/DS500538 RHEL 6.9 http://support.lenovo.com.cn/PurleyWeb/ThinkSystemDetail.html?ID=200575 http://datacentersupport.lenovo.com/downloads/DS500278 RHEL 7.3 http://support.lenovo.com.cn/PurleyWeb/ThinkSystemDetail.html?ID=200574 http://datacentersupport.lenovo.com/downloads/DS500305 SLES 11 SP4 http://support.lenovo.com.cn/PurleyWeb/ThinkSystemDetail.html?ID=200649 http://datacentersupport.lenovo.com/downloads/DS500279 SLES 12 SP2 http://support.lenovo.com.cn/PurleyWeb/ThinkSystemDetail.html?ID=200571 http://datacentersupport.lenovo.com/downloads/DS500304 如果要全新安装SUSE Enterprise Linux 11 SP4及SUSE Enterprise Linux 12 SP2操作系统,可以使用ThinkSystem Bootable Driver Kit(即kISO镜像),其中包含最新版本的驱动。SUSE官网下载连接: https://drivers.suse.com/index.php?vendor=Lenovo&SLE=none&name=ThinkSystem 对于CentOS 7.3和RHEL 7.3,还可以参考Red Hat官网的指导: https://access.redhat.com/errata/RHEA-2017:1730 对于Oracle Linux,需要在内核参数中加入一条对Matrox显卡驱动的blacklist: modprobe.blacklist=mgag200备注:本文翻译自联想(国际)官网文档,并进行一定重新编译。来源:https://support.lenovo.com/us/zh/solutions/ht505175
解决ThinkSystem板载显卡(Matrox MGA200)驱动致系统宕机-联想乐享知识库
⚡ 核心结论
本文来源联想官方,解答关于 解决ThinkSystem板载显卡(Matrox MGA200)驱动致系统宕机 的常见问题,包括:ThinkSystem服务器因Matrox MGA200板载显卡驱动导致系统不定时宕机怎么办、ThinkSystem服务器如何更新Matrox MGA200板载显卡驱动以避免宕机、ThinkSystem服务器Matrox MGA200显卡导致系统宕机的原因是什么等。
内容来源:联想官方
常见问题解答
ThinkSystem服务器因Matrox MGA200板载显卡驱动导致系统不定时宕机怎么办
该问题源于Matrox G200e图形芯片在非零值写入高优先级寄存器时触发亚稳态,阻塞PCI-E视频数据队列,引发PCI-E总线超时、IERR错误及系统宕机。解决方案:对Windows Server 2012 R2/2016、RHEL 6.9/7.3、SLES 11 SP4/12 SP2,需更新至联想官方发布的修复版驱动;下载地址已按系统分类提供(如RHEL 7.3对应ID=200574的中国官网页面及DS500305国际页面);全新安装SLES 11 SP4或12 SP2时,建议使用含最新驱动的ThinkSystem Bootable Driver Kit(kISO镜像);CentOS 7.3用户可参照Red Hat Errata RHEA-2017:1730;Oracle Linux用户须在内核启动参数中添加modprobe.blacklist=mgag200。
ThinkSystem服务器如何更新Matrox MGA200板载显卡驱动以避免宕机
请按操作系统类型执行以下步骤:1. 访问对应官方下载页——Windows Server 2012 R2/2016前往http://support.lenovo.com.cn/PurleyWeb/ThinkSystemDetail.html?ID=199741(中国)或http://datacentersupport.lenovo.com/downloads/DS500538(国际);RHEL 6.9访问ID=200575页面,RHEL 7.3访问ID=200574页面;SLES 11 SP4和12 SP2分别访问ID=200649与ID=200571页面;2. 下载驱动包后,严格按随附txt readme文档说明安装;3. 若为SLES全新部署,推荐使用ThinkSystem Bootable Driver Kit(kISO)启动安装,该镜像已集成修复驱动;4. Oracle Linux用户需编辑/boot/grub2/grub.cfg或grub.conf,在kernel行末尾添加modprobe.blacklist=mgag200并更新grub;5. 安装后务必重启验证。
⚠️ 注意事项:
1. 服务器操作风险较高,更新驱动前请务必备份重要数据及系统配置。
2. 请在业务低峰期进行操作,驱动安装后通常需要重启服务器。
3. 严格核对操作系统版本与驱动版本的对应关系,避免版本不匹配。
4. 请务必查阅完整的官方文档,确保操作步骤未被遗漏。
⚠️ 注意事项:
1. 服务器操作风险较高,更新驱动前请务必备份重要数据及系统配置。
2. 请在业务低峰期进行操作,驱动安装后通常需要重启服务器。
3. 严格核对操作系统版本与驱动版本的对应关系,避免版本不匹配。
4. 请务必查阅完整的官方文档,确保操作步骤未被遗漏。
ThinkSystem服务器Matrox MGA200显卡导致系统宕机的原因是什么
根本原因是Matrox G200e图形芯片存在硬件设计缺陷:当向其高优先级寄存器写入非零值时,会进入亚稳态,进而阻塞PCI-E接口上的视频数据队列;该阻塞最终引发PCI-E总线超时错误,触发不可恢复错误(IERR),导致整个系统宕机。此缺陷影响全系列ThinkSystem服务器,且在Windows Server 2012 R2/2016、RHEL 6.x/7.x、SLES 11.x/12.x、CentOS及Oracle Enterprise Linux等主流企业级操作系统上均被复现。