使用 CLI 将已修复的节点重新添加到集群系统中
在修复了发生故障的节点后,可以使用命令行界面 (CLI) 将该节点重新添加到集群系统中。
开始之前
在将节点添加到集群系统之前,必须确保已配置交换机分区,使正在添加的节点与集群系统中的所有其他节点位于同一区域中。如果要更换节点并且按全球端口名 (WWPN)(而不是按交换机端口)对交换机进行分区,请确保已配置交换机,使正在添加的节点位于同一 VSAN/区域中。
- 如果要将节点重新添加到 SAN 中,请确保将该节点添加到已从中除去该节点的同一个 I/O 组中。如果未选择正确的 I/O 组,那么会造成数据损坏。您必须使用节点最初添加到集群系统时所记录的信息。如果您无权访问这些信息,请致电 IBM® 支持中心,请求其将节点重新添加到集群系统,而不会损坏数据。
- 提供给新节点上端口的 LUN 必须与提供给集群系统中当前存在的节点的 LUN 相同。在将新节点添加到集群系统之前,必须确保 LUN 相同。
- 在集群系统中的所有节点上,每个 LUN 的 LUN 屏蔽必须相同。在将新节点添加到集群系统之前,必须确保每个 LUN 的 LUN 屏蔽相同。
- 必须确保新节点的型号类型受集群系统上安装的 SAN Volume Controller 软件级别支持。如果型号类型不受 SAN Volume Controller 软件级别的支持,请将集群系统更新到支持新节点型号类型的软件级别。请访问以下 Web 站点,以获取最新的受支持软件级别:
关于此任务
向集群系统添加节点时使用的特殊过程
主机系统上的应用程序会将 I/O 操作定向至由操作系统映射到虚拟路径 (vpath) 的文件系统或逻辑卷,它们是子系统设备驱动程序 (SDD) 支持的伪磁盘对象。SDD 将维护 vpath 与 SAN Volume Controller 卷之间的关联。此关联使用卷独有且从未被复用的标识 (UID)。 该 UID 允许 SDD 直接将 vpath 与卷相关联。
SDD 在包含磁盘和光纤通道设备驱动程序的协议堆栈中运行,用于按照 ANSI FCS 标准的定义,使用 SCSI 协议通过光纤通道与 SAN Volume Controller 进行通信。这些 SCSI 和光纤通道设备驱动程序提供的寻址方案将 SCSI 逻辑单元号 (LUN) 和全球节点名 (WWNN) 的组合用于光纤通道节点和端口。
如果发生错误,错误恢复过程 (ERP) 将在协议堆栈中的各个层运行。其中一些 ERP 会导致使用先前使用的相同 WWNN 和 LUN 号来重新驱动 I/O。
SDD 不会对它执行的每个 I/O 操作检查卷与 vpath 的关联。
- 集群系统有多个 I/O 组。
- 正在添加到集群系统的节点使用先前用于集群系统中节点的物理节点硬件或插槽。
- 正在添加到集群系统的节点使用先前用于另一个集群系统中节点的物理节点硬件或插槽,并且两个集群系统能识别相同的主机和后端存储器。
- 必须将节点添加到它先前所在的同一个 I/O 组。可以使用命令行界面 (CLI) 命令 lsnode 或管理 GUI 确定集群系统节点的 WWNN。
- 在将节点重新添加到集群系统之前,必须关闭所有使用集群系统的主机。然后,在重新引导这些主机之前,必须添加该节点。
如果 I/O 组信息不可用,或者不方便通过集群系统来关闭并重新引导所有主机,请执行以下操作:
- 在连接到集群系统的所有主机上,取消配置光纤通道适配器设备驱动程序、磁盘设备驱动程序和多路径驱动程序,然后再将节点添加到集群系统。
- 将节点添加到集群系统,然后重新配置光纤通道适配器设备驱动程序、磁盘设备驱动程序和多路径驱动程序。
适用特殊过程的场景
- 由于一对 2145 UPS
或四个 2145 UPS-1U
发生故障,导致八节点集群系统中的四个节点丢失。在此情况下,必须使用 CLI 命令 addnode 或管理 GUI 将这四个节点重新添加到集群系统中。注: 无需在其伙伴已包含在集群系统中的节点上运行 addnode 命令;集群系统会自动检测联机候选者。
- 用户决定从集群系统中删除四个节点,并且使用 CLI 命令 addnode 或管理 GUI 将这些节点重新添加到集群系统中。
对于 5.1.0 节点,SAN Volume Controller 会自动将发生故障的节点重新添加到集群系统中。如果集群系统报告节点缺失错误(错误代码 1195),并且该节点已修复并重新启动,那么集群系统会自动将该节点重新添加到集群系统中。该过程可能最多需要 20 分钟,因此可完成以下步骤来手动重新添加节点: