在安装新主板时,会复用在卸下旧主板时卸下的所有组件。
开始之前
机器序列号或节点序列号位于 SAN Volume Controller 2145-DH8 前部的 MT-M SN 标签上。序列号还会在节点制造时写入到主板中以及每个引导驱动器中。当系统软件启动时,会从主板中读取节点序列号并将序列号用作此节点的面板标识。可以在很多位置看到面板标识,比如在服务助手 GUI、管理 GUI 以及很多 CLI 命令的输出中。
如果主板更换为 FRU 部件,那么其机器序列号为 0000000,并且 SAN Volume Controller 2145-DH8 节点的 panel_id 为 0000000。这将与每个引导驱动器上存储的节点序列号不匹配,从而导致节点错误 545。如果每个引导驱动器上节点序列号的副本不匹配,那么节点错误为 543。以下描述了有关修复节点错误的过程
确保以下项可用:
- 可能需要 VGA 监视器和 USB 键盘。
- 节点的电源线,以便在节点离开机架之后可以开启。
- 具有以太网端口和 Web 浏览器并且可以直接连接到技术人员端口的计算机,以便访问服务助手 GUI。需要支持 Ssh 功能的软件以访问 CLI (PuTTY)。
- 需要酒精拭布和导热油脂以正确更换微处理器。在更换主板时,必须卸下微处理器。
注: 在重新组装节点中的组件时,务必仔细布放所有电缆,避免承受过大压力。
危险
多根电源线。本产品可能配备有多根电源线。要除去所有危险的电压,请断开所有电源线的连接。(L003)
关于此任务
此维护操作假定:
- 已关闭该节点。
- 电源线已断开连接。
- 节点从机架中卸下。
- 顶盖已卸下。
- 已卸下空气挡板。
- PCI Express 转接卡组合件已卸下。
- 连接到电池底板的电缆已拔掉。
- 主板已卸下。
- 新主板来自 FRU 库存,不得来自其他 SAN Volume Controller 2145-DH8 或任何其他机器。
- 请避免同时更换两个引导驱动器,否则如果没有 IBM 远程技术支持的帮助将无法恢复。
请执行以下步骤以安装主板:
过程
- 使主板保持一定角度,如图 1 中所示。
- 旋转并放低主板,以使其水平然后朝着服务器后部向后滑动。确保后部接口可伸出机箱后部。
图 1. 更换 SAN Volume Controller 2145-DH8 主板
- 重新连接您之前断开的主板电缆。
- 朝着服务器后部方向旋转主板指旋螺钉,直至滑锁咔哒一声锁定到位。
- 重新安装微处理器和散热器,如更换微处理器:2145-DH8 中所述。
- 重新安装 DIMM,如更换内存条:2145-DH8 中所述。
- 重新安装风扇支架,如“更换 SAN Volume Controller 2145-DH8 风扇支架”中所述。
- 重新安装热插拔风扇,如“更换 SAN Volume Controller 2145-DH8 风扇”中所述。
- 重新安装空气挡板。
- 重新安装电源单元。
- 更换 PCI Express 转接卡组合件。
- 请确保所有电缆]适配器和其他组件都已安装牢固,并且没有将松散的工具或部件留在节点内部。 确保所有内部电缆布放正确。 如果断开光纤通道和以太网电缆的连接,请确保所有电缆都重新连接到正确的端口。
- 重新安装顶盖。请参阅重新安装外盖。
- 如果已从机架中卸下节点,请将节点重新安装到机架中,如更换机架中的节点中所述。
- 如果拔下了任何光纤通道电缆、SAS 电缆或以太网电缆,根据您贴在每根电缆上的标签将电缆连接到原先所在的端口。
- 更换电源线和电缆固定器支架。
- 抬起滑轨上的锁定拉杆(图 2 中的 1 ),将服务器 2 全部推入机架,直到其咔嗒一声锁定到位。
图 2. 抬起机架滑轨的 SAN Volume Controller 2145-DH8锁紧杆
- 开启节点。 在采取任何其他操作之前,等待节点状态指示灯保持稳定至少五分钟。
如果您是完成此过程的服务代表,此过程可能最多需要两个小时才能完成。
备注: - 如果节点状态、节点故障和电池状态指示灯熄灭超过 5 分钟,请连接监视器和 USB 键盘以更改缺省引导顺序。
- 如果修复成功,那么节点故障指示灯将点亮,并且您将在服务助手 GUI 中看到针对此节点显示的节点错误 545:
- 如果显示节点错误 543 而非节点错误 545,请检查以下各项:
备注: - 如果主板上的机器序列号是 0000000,那么节点错误 543 表示每个引导驱动器上节点序列号的副本不匹配。例如,当节点序列号由于引导驱动器丢失而无法读取时。
- 使用服务助手 GUI 或 CLI 命令 sainfo lsbootdrive 来查看每个引导驱动器插槽的状态。请参阅“引导驱动器问题”以确定要执行的下一步操作。
- 例如,sainfo lsbootdrive 的输出显示:
- 主板上的节点号为 0000000(七个零),显示为 panel_id。
- 一个引导驱动器插槽的节点序列号与此节点前部 MT-M SN 标签上的序列号完全相同。
- 另一个引导驱动器插槽的状态为 uninitialized。
- 仅当上述三个条件均已满足时,才能使用服务助手 GUI 或以下 CLI 命令来初始化那些未初始化的引导驱动器:
satask rescuenode
- 这样会重新引导该节点
- 在服务助手 GUI 中针对此节点显示节点错误 545
- 按如上所述写下节点序列号。
- 如果修复成功但节点无法在关闭之前保存其状态数据,那么此节点将显示节点错误 578。请遵循使用管理 GUI 从集群系统中删除节点中的过程来从集群中删除节点,然后将其重新添加到集群中。
如果多个节点发生故障,请确保将该节点重新添加到其原始 I/O 组中。