使用 CLI 将已修复的节点重新添加到集群系统中

在修复了发生故障的节点后,可以使用命令行界面 (CLI) 将该节点重新添加到集群系统中。

开始之前

在将节点添加到集群系统之前,必须确保已配置交换机分区,使正在添加的节点与集群系统中的所有其他节点位于同一区域中。如果要更换节点并且按全球端口名 (WWPN)(而不是按交换机端口)对交换机进行分区,请确保已配置交换机,使正在添加的节点位于同一 VSAN/区域中。

注意:
  1. 如果要将节点重新添加到 SAN 中,请确保将该节点添加到已从中除去该节点的同一个 I/O 组中。如果未选择正确的 I/O 组,那么会造成数据损坏。您必须使用节点最初添加到集群系统时所记录的信息。如果您无权访问这些信息,请致电 IBM® 支持中心,请求其将节点重新添加到集群系统,而不会损坏数据。
  2. 提供给新节点上端口的 LUN 必须与提供给集群系统中当前存在的节点的 LUN 相同。在将新节点添加到集群系统之前,必须确保 LUN 相同。
  3. 在集群系统中的所有节点上,每个 LUN 的 LUN 屏蔽必须相同。在将新节点添加到集群系统之前,必须确保每个 LUN 的 LUN 屏蔽相同。
  4. 必须确保新节点的型号类型受集群系统上安装的 SAN Volume Controller 软件级别支持。如果型号类型不受 SAN Volume Controller 软件级别的支持,请将集群系统更新到支持新节点型号类型的软件级别。请访问以下 Web 站点,以获取最新的受支持软件级别:

    www.ibm.com/support

关于此任务

向集群系统添加节点时使用的特殊过程

主机系统上的应用程序会将 I/O 操作定向至由操作系统映射到虚拟路径 (vpath) 的文件系统或逻辑卷,它们是子系统设备驱动程序 (SDD) 支持的伪磁盘对象。SDD 将维护 vpath 与 SAN Volume Controller 卷之间的关联。此关联使用卷独有且从未被复用的标识 (UID)。 该 UID 允许 SDD 直接将 vpath 与卷相关联。

SDD 在包含磁盘和光纤通道设备驱动程序的协议堆栈中运行,用于按照 ANSI FCS 标准的定义,使用 SCSI 协议通过光纤通道SAN Volume Controller 进行通信。这些 SCSI 和光纤通道设备驱动程序提供的寻址方案将 SCSI 逻辑单元号 (LUN) 和全球节点名 (WWNN) 的组合用于光纤通道节点和端口。

如果发生错误,错误恢复过程 (ERP) 将在协议堆栈中的各个层运行。其中一些 ERP 会导致使用先前使用的相同 WWNN 和 LUN 号来重新驱动 I/O。

SDD 不会对它执行的每个 I/O 操作检查卷与 vpath 的关联。

在向集群系统添加节点之前,必须检查以确定是否满足以下任何条件:
  • 集群系统有多个 I/O 组。
  • 正在添加到集群系统的节点使用先前用于集群系统中节点的物理节点硬件或插槽。
  • 正在添加到集群系统的节点使用先前用于另一个集群系统中节点的物理节点硬件或插槽,并且两个集群系统能识别相同的主机和后端存储器。
如果满足上述任何条件,那么以下特殊过程适用:
  • 必须将节点添加到它先前所在的同一个 I/O 组。可以使用命令行界面 (CLI) 命令 lsnode管理 GUI 确定集群系统节点的 WWNN。
  • 在将节点重新添加到集群系统之前,必须关闭所有使用集群系统的主机。然后,在重新引导这些主机之前,必须添加该节点。 如果 I/O 组信息不可用,或者不方便通过集群系统来关闭并重新引导所有主机,请执行以下操作:
    • 在连接到集群系统的所有主机上,取消配置光纤通道适配器设备驱动程序、磁盘设备驱动程序和多路径驱动程序,然后再将节点添加到集群系统。
    • 将节点添加到集群系统,然后重新配置光纤通道适配器设备驱动程序、磁盘设备驱动程序和多路径驱动程序。

适用特殊过程的场景

以下两个场景描述了适用特殊过程的情况:
  • 由于一对 2145 UPS 或四个 2145 UPS-1U 发生故障,导致八节点集群系统中的四个节点丢失。在此情况下,必须使用 CLI 命令 addnode管理 GUI 将这四个节点重新添加到集群系统中。
    注: 无需在其伙伴已包含在集群系统中的节点上运行 addnode 命令;集群系统会自动检测联机候选者。
  • 用户决定从集群系统中删除四个节点,并且使用 CLI 命令 addnode管理 GUI 将这些节点重新添加到集群系统中。

对于 5.1.0 节点,SAN Volume Controller 会自动将发生故障的节点重新添加到集群系统中。如果集群系统报告节点缺失错误(错误代码 1195),并且该节点已修复并重新启动,那么集群系统会自动将该节点重新添加到集群系统中。该过程可能最多需要 20 分钟,因此可完成以下步骤来手动重新添加节点:

过程

  1. 发出 lsnode CLI 命令以列出集群系统中当前包含的节点,并确定要为其添加节点的 I/O 组。

    以下是所显示输出的示例:

    lsnode -delim :
    id:name:UPS_serial_number:WWNN:status:IO_group_id:IO_group_name
    :config_node:UPS_unique_id:hardware:iscsi_name:iscsi_alias
    :panel_name:enclosure_id:canister_id:enclosure_serial_number
    1:node1::50050868010050B2:online:0:io_grp0:yes::100:iqn.1986-03.com.ibm
    :2145.cluster0.node1::02-1:2:1:123ABCG
    2:node2::50050869010050B2:online:0:io_grp0:no::100:iqn.1986-03.com.ibm
    :2145.cluster0.node2::02-2:2:2:123ABDG
    lsnode -delim :
    Id:name:UPS_serial_number:WWNN:status:IO_group_id:IO_group_name
    :config_node:UPS_unique_id:hardware:iscsi_name:iscsi_alias
    :panel_name:enclosure_id:canister_id:enclosure_serial_number
    1:node1:UPS_Fake_SN:50050768010050B1:online:0:io_grp0:yes
    :10000000000050B1:8G4:iqn.1986-03.com.ibm:2145.cluster0.node1:000368:::
  2. 发出 lsnodecandidate CLI 命令以列出未分配到集群系统的节点,并验证是否向 I/O 组添加了另一个节点。

    以下是所显示输出的示例:

    lsnodecandidate -delim :
    id:panel_name:UPS_serial_number:UPS_unique_id:hardware
    5005076801000001:000341:10L3ASH:202381001C0D18D8:8A4
    5005076801000009:000237:10L3ANF:202381001C0D1796:8A4
    50050768010000F4:001245:10L3ANF:202381001C0D1796:8A4
    ....
  3. 发出 addnode CLI 命令以向集群系统添加节点。
    要点: I/O 组中的每个节点必须连接到不同的不间断电源。

    下面是一个 CLI 命令示例,您可发出该命令以通过面板名称参数向集群系统添加节点:

    addnode -panelname 000237
     -iogrp io_grp0

    其中,000237 是节点的面板名称,io_grp0 是要将节点添加到的 I/O 组的名称。

    下面是一个 CLI 命令示例,您可发出该命令以通过 WWNN 参数向集群系统添加节点:

    addnode -wwnodename 5005076801000001
     -iogrp io_grp1

    其中,5005076801000001 是节点的 WWNN,io_grp1 是要将节点添加到的 I/O 组的名称。

  4. 发出 lsnode CLI 命令以验证最终配置。

    以下示例给出了所显示的输出:

    lsnode -delim :
    id:name:UPS_serial_number:WWNN:status:IO_group_id:IO_group_name:config_node:UPS_unique_id:
    hardware:iscsi_name:iscsi_alias
    1:node1:10L3ASH:0000000000000000:offline:0:io_grp0:no:1000000000003206:
    8A4:iqn.1986-03.com.ibm:2145.ndihill.node1:
    记录新节点的以下信息:
    • 节点名
    • 节点序列号
    • WWNN
    • IQN(如果所用主机通过 iSCSI 连接进行连接)
    • 所有 WWPN
    • 包含节点的 I/O 组
    注: 如果在将节点添加到集群系统后立即发出此命令,那么节点状态可能为“正在添加”。如果将节点添加到集群系统的过程仍在进行中,那么状态显示为“正在添加”。不必等待所有节点都变为联机状态,就可继续执行配置过程。

结果

已将这些节点添加到集群系统中。