更换集群系统 (clustered system)中的故障节点

可以使用命令行界面 (CLI)和系统前面板来更换集群系统 (clustered system)中的故障节点。

开始之前

尝试将故障节点更换为备用节点之前,必须确保满足以下需求:
  • 您知道包含故障节点的系统的名称。
  • 备用节点安装在包含故障节点的系统所在的机架中。
  • 必须记录备用节点的原始全球节点名 (WWNN) 的最后 5 个字符。如果修复故障节点并要使之成为备用节点,那么可以使用该节点的 WWNN。不能重复 WWNN,因为它是唯一的。当使用 WWNN 时,比较容易换入节点。
注意: 切勿将 WWNN 为 00000 的节点连接到系统。 如果不再需要此节点作为备用节点并且要将其用于正常连接,那么必须将 WWNN 更改为创建备用节点时记录的数字。使用任何其他数字都可能会导致数据损坏。

关于此任务

如果节点发生故障,那么系统的运行性能会有所下降,直至故障节点得以修复为止。如果修复操作所需的时间不可接受,那么使用备用节点更换故障节点会很有用。然而,必须遵循适当的过程并采取预防措施,以便不会中断 I/O 操作和破坏数据的完整性。

特别要确保 I/O 组中的伙伴节点处于联机状态。
  • 如果 I/O 组中的另一个节点处于脱机状态,请启动修复过程以确定故障。
  • 如果修复过程已将您引导至此处,并且随后 I/O 组中的伙伴节点发生故障,请参阅节点或 I/O 组发生故障后从脱机进行恢复的过程。
  • 如果由于其他原因更换节点,请确定要更换的节点并确保 I/O 组中的伙伴节点处于联机状态。
  • 如果伙伴节点处于脱机状态,那么您将无法访问属于该 I/O 组的。启动修复过程并修复另一个节点,然后再继续执行下一步。
表 1 描述了在更换集群系统 (clustered system)中的故障节点时所做的配置更改。
表 1. 节点属性的更改摘要
节点属性 描述
前面板标识 此标识是印制在节点前部的数字,用于选择已添加到系统的节点。
节点标识 此标识分配给节点。每次向系统中添加节点时,会分配新的节点标识;在系统上进行维护活动后,节点名保持不变。可以使用节点标识或节点名在系统上执行管理任务。然而,如果使用脚本来执行这些任务,请使用节点名而不是节点标识。在该过程中,此标识将更改。
节点名 节点名是分配给节点的名称。系统自动将发生故障的节点重新添加到系统中。如果系统报告节点缺失错误(错误代码 1195)并且该节点已修复并重新启动,那么系统会自动将该节点重新添加到系统中。

如果选择分配您自己的名称,那么必须在 Adding a node to a cluster 面板上输入节点名。不能手动分配符合系统用于自动分配名称的命名约定的名称。如果是使用脚本在系统上执行管理任务并且这些脚本使用节点名,那么可以通过将节点的原始名称分配给备用节点来避免更改脚本。 在此过程期间,此名称可能会更改。

全球节点名 这是分配给节点的 WWNN。WWNN 用于唯一标识节点和光纤通道端口。在此过程中,备用节点的 WWNN 将更改为故障节点的 WWNN。必须严格遵循节点更换过程,以避免任何 WWNN 重复。在此过程中,此名称不会更改。
全球端口名 这些是分配给节点的 WWPN。WWPN 派生自该过程中写入备用节点的 WWNN。 例如,如果节点的 WWNN 为 50050768010000F6,那么将派生出该节点的如下四个 WWPN:
WWNN                          50050768010000F6
前面板 000F6 上显示的 WWNN
WWPN Port 1                   50050768014000F6
WWPN Port 2                   50050768013000F6
WWPN Port 3                   50050768011000F6
WWPN Port 4                   50050768012000F6
在该过程期中,这些名称不会更改。

请转至在不中断运行的情况下更换节点过程,了解用于更换系统中故障节点的特定步骤。