解决 SAN Volume Controller 引导驱动器的问题

请完成以下步骤以解决 SAN Volume Controller 引导驱动器的大多数问题。

开始之前

节点序列号(也称为产品或机器序列号)位于节点左前端的 MT-M S/N 标签(“机器类型 - 型号和序列号”标签)上。 在制造过程中,节点序列号会写入主板和两个引导驱动器中。

启动 SAN Volume Controller 软件时,该软件会从主板中读取节点序列号(将该节点序列号用作面板名称),并且会将该序列号与两个引导驱动器中存储的节点序列号进行比较。

在以下情况下,会产生一些特殊的节点错误:
  • 不可恢复的节点错误 543:此错误指示存储在三个位置中的节点序列号都不匹配。 主板中的节点序列号必须与两个引导驱动器中的至少一个匹配, SAN Volume Controller 软件才会认为该节点序列号有效。
  • 不可恢复的节点错误 545:此错误指示两个引导驱动器中的节点序列号相互匹配,但与主板中的节点序列号不同。 在这种情况下,可能是主板中的节点序列号有误,也可能是引导驱动器中的节点序列号有误。 例如,更换了主板,或者引导驱动器来自其他节点。
  • 节点错误 743:此错误指示由于两个引导驱动器中的一个发生故障、缺失或与另一个引导驱动器不同步,而无法从该驱动器中读取节点序列号。
  • 节点错误 744:此错误指示来自其中一个引导驱动器的节点序列号被识别为属于其他节点。 如果互换了驱动器插槽 1 和 2 中的引导驱动器,那么会产生节点错误 744。
  • 节点错误 745:此错误指示在不受支持的插槽中发现引导驱动器。 当前两个驱动器中至少有一个驱动器处于联机状态并且占用了至少一个无效插槽 (3-8) 时,会发生该错误。

关于此任务

如果问题产生节点错误 743、744 或 745,那么在管理 GUI 的“监控 > 事件”面板中会显示一个事件。 请针对此事件运行修复过程。 否则,请连接到技术人员端口,以利用节点上的 MT-M S/N 标签来查看引导驱动器插槽信息并确定问题。

注意: 如果驱动器插槽在“活动”列中的值为 Yes,那么操作系统将依赖于该驱动器。 请不要在未事先关闭节点的情况下卸下该驱动器。
  • 请不要互换插槽中的引导驱动器。
  • 每个引导驱动器都具有主板上的 VPD 的副本。
  • 每次仅对一个引导驱动器进行软件升级,以防止在 CCU 期间发生故障。

过程

要解决引导驱动器的问题,请按顺序完成以下步骤:

  1. 卸下不受支持的插槽中的驱动器。 如果可能,请将该驱动器移到正确的插槽中。
  2. 如果可能,请重新安装插槽中缺少的驱动器。 否则,请重新安装原来的驱动器,或将其更换为来自 FRU 库存的驱动器。
  3. 将位于错误节点中的任何驱动器移回到正确的节点中。
    注: 如果其节点序列号与主板中的节点序列号不匹配,那么驱动器插槽的状态为 wrong_node。 如果 MT-M S/N 标签上的序列号与驱动器上的节点序列号匹配,那么可以忽略此状态。
  4. 将位于错误插槽中的任何驱动器移回到正确的插槽中。
  5. 将驱动器重新安装到状态为 failed 的任意插槽中。 如果该插槽的状态仍为 failed,请将驱动器更换为来自 FRU 库存的驱动器。
  6. 如果驱动器插槽的状态为 out of sync,并且其在 can_sync 列中的值为 Yes,那么:
    • 使用服务助手 GUI 来同步引导驱动器,或者
    • 使用命令行界面 (CLI) 命令 satask chbootdrive -sync
    • 如果在 can_sync 列中显示 No,那么必须首先解决其他引导驱动器问题。

更换主板:

  1. 更换 SAN Volume Controller 2145-DH8 SAN Volume Controller 2145-SV1 主板。

如果两个引导驱动器都没有可用的 SAN Volume Controller 软件:

例如,如果同时使用来自 FRU 库存的驱动器来更换两个引导驱动器,那么两个引导驱动器都没有可用的 SAN Volume Controller 软件。 如果未在运行 SAN Volume Controller 软件,那么节点状态、节点故障、电池状态和电池故障指示灯仍然熄灭。

  1. 如果无法将至少一个原始引导驱动器更换为合适的驱动器(包含可用的 SAN Volume Controller 软件且具有与节点前端的 MT-M S/N 标签匹配的节点序列号),请联系 IBM® 远程技术支持人员。
    IBM 远程技术支持人员可帮助您使用可引导 USB 闪存驱动器来安装 SAN Volume Controller 软件。
    • 现场 USB 安装还可通过找到在制造过程中存储在主板上的相应值,以修复每个引导驱动器上存储的节点序列号和 WWNN。
    • 如果此节点的 WWNN 在过去曾被更改过,那么必须在完成 SAN Volume Controller 软件安装后再次更改该 WWNN。 例如,如果节点更换了先前的 SAN Volume Controller 节点,那么必须将 WWNN 更换为先前节点的 WWNN。 在安装 SAN Volume Controller 软件后,可使用服务助手 GUI 或使用命令来对 WWNN 进行同样的更改。

当节点序列号的所有副本都丢失时:

例如,如果使用来自 FRU 库存的部件同时更换了主板和两个引导驱动器,那么节点序列号的所有副本都将丢失。

  1. 如果因无法更换其中一个原始引导驱动器或原始主板,以致存在原始节点序列号的至少一个副本,那么无法现场修复该节点。 将该节点返还给 IBM 来进行修复。

结果

仅在 SAN Volume Controller 软件可能未自动初始化 FRU 驱动器时,驱动器插槽的状态才为“未初始化”。 如果另一个引导驱动器中的节点序列号与主板中的节点序列号不匹配,那么会出现此状态。 如果另一个引导驱动器中的节点序列号与节点左前端的 MT-M S/N 标签匹配,那么可以安全地从另一个引导驱动器抢救未初始化的引导驱动器。 可使用服务助手 GUI 或 satask rescuenode 命令抢救该驱动器。