在不中断运行的情况下更换节点

这些过程描述了如何以非破坏性方式更换大多数节点。

开始之前

由于不需要对 SAN 环境进行更改,因此这些过程不会中断系统运行。更换(新)节点使用与被替换节点相同的全球节点名 (WWNN)。该过程的备选方法是通过将卷移至新的 I/O 组或者对 SAN 进行重新分组,在不中断运行的情况下更换节点。 但是,中断性过程需要对主机进行其他处理。

该任务假定已满足以下条件:

  • 现有系统软件必须是支持新节点的版本。如果要用 SAN Volume Controller 2145-CG8 节点来更换某节点,那么系统软件版本必须为 6.2.0 或更高版本。如果要用 SAN Volume Controller 2145-CF8 节点来更换某节点,那么系统软件版本必须为 5.1.0 或更高版本。如果要用 SAN Volume Controller 2145-8A4 节点来更换某节点,那么系统软件版本必须为 4.3.1 或更高版本。
    注: 对于包含闪存驱动器 的节点:如果现有 闪存驱动器 移至新节点,那么新节点必须包含必要的串行连接 SCSI (SAS) 适配器以支持 闪存驱动器
  • 系统中配置的所有节点都存在且处于联机状态。
  • 系统事件日志中的所有错误都已处理并标记为“已纠正”。
  • 没有处于性能下降或脱机状态的卷、受管磁盘 (MDisk) 或外部存储系统。
  • 更换节点未开启。
  • 更换节点未与 SAN 相连。
  • 对于每个新的 SAN Volume Controller 2145-CG8 SAN Volume Controller 2145-CF8SAN Volume Controller 2145-8A4 节点,均有一个 2145 UPS-1U 单元(功能部件代码 8115)。
  • 已备份系统配置并保存 svc.config.backup.xml 文件。
  • 更换节点必须能够以被更换节点的光纤通道或以太网连接速度运行。
  • 如果被更换节点包含闪存驱动器,请将所有 闪存驱动器 和 SAS 适配器传输到新的节点(如果该节点支持这些驱动器)。如果新节点不支持现有 闪存驱动器,请在更换节点前将数据从 闪存驱动器 传送出去,以防止失去对数据的访问权。
要点:
  1. 如果上述所列的任何条件没有得到满足,请不要继续执行此任务,除非IBM® 支持中心指示您这样做。
  2. 在执行此任务前,请查看要遵循的所有步骤。
  3. 如果您不熟悉 SAN Volume Controller 环境或此任务中描述的过程,请不要执行此任务。
  4. 如果计划复用所更换的节点,请确保将节点的 WWNN 设置为 SAN 上的唯一编号。如果不能确保 WWNN 的唯一性,WWNN 和 WWPN 在 SAN 环境中会出现重复,从而造成问题。
    提示: 可以将所更换节点的 WWNN 更改为更换节点的出厂缺省 WWNN,以确保编号的唯一性。
  5. 在此任务中,节点标识会发生更改,节点名称也可能更改。 在系统分配了节点标识后,无法再更改此标识。但在此任务完成后,可以更改节点名称。

关于此任务

执行以下步骤以更换系统中的活动节点:

过程

  1. (如果系统软件版本为 5.1 或更高版本,请完成该步骤)。

    确认没有主机依赖于节点。

    当关闭属于系统的节点或从系统删除节点时,可以使用管理 GUI 或命令行界面(CLI) 命令。 在管理 GUI 中,选择监控 > 系统 > 管理。 单击显示从属卷以显示所有依赖该节点的卷。 您还可以将 node 参数和 lsdependentvdisks CLI 命令结合使用来查看从属卷。

    如果存在从属卷,请确定是否正在使用这些卷。 如果该卷正在被使用,请恢复冗余配置或者暂挂主机应用程序。 如果报告了从属定额磁盘,请修复对定额磁盘的访问权或修改定额磁盘配置。

  2. 使用以下步骤以确定系统配置节点,以及要更换的节点的标识、名称、I/O 组标识和 I/O 组名称。如果已经知道要更换的节点的物理位置,可以跳过此步骤,继续执行 3
    提示: 如果要更换的其中一个节点是系统配置节点,请将其最后更换。
    1. 从命令行界面 (CLI) 发出以下命令:
      lsnode -delim :

      以下输出是该命令显示的输出示例:

      id:name:UPS_serial_number:WWNN:status:IO_group_id:IO_group_name:
      config_node:UPS_unique_id:hardware:iscsi_name:iscsi_alias
      3:dvt113294:100089J137:5005076801005A07:online:0:io_grp0:yes:
      20400002096810C7:8A4:iqn.1986-03.com.ibm:2145.ldcluster-80.dvt113294:
      14:des113004:10006BR010:5005076801004F0F:online:0:io_grp0:no:
      2040000192880040:8G4:iqn.1986-03.com.ibm:2145.ldcluster-80.des113004:
    2. config_node 列中,找到值 yes,然后将这些值记录在 idname 列中。
    3. 将这些值记录在系统中每个节点的 idname 列中。
    4. 将这些值记录在系统中每个节点的 IO_group_idIO_group_name 列中。
    5. 针对系统中的每个节点,从 CLI 发出以下命令以确定前面板标识:
      lsnodevpd node_name or node_id

      其中,node_name or node_id 为要确定其前面板标识的节点的名称或标识。

    6. 将该值记录在 front_panel_id 列中。 前面板标识显示在每个节点的前部。可以使用此标识来确定与要更换的节点标识或节点名称相匹配的节点的物理位置。
  3. 请执行以下步骤以记录要更换的节点的 WWNN 或 iSCSI 名称
    1. 从 CLI 发出以下命令:
      lsnode -delim : node_name or node_id

      其中,node_name or node_id 是想要确定其 WWNN 或 iSCSI 名称的节点的名称或标识。

    2. 记录要更换的节点的 WWNN 或 iSCSI 名称。另请记录光纤通道端口和以太网端口的顺序。
  4. 从 CLI 发出以下命令以关闭节点:
    stopsystem -node node_name
    要点:
    1. 从节点后部拔下电缆之前,请记录并标记光纤通道或以太网电缆的顺序以及节点端口号(端口 1 到 4 用于光纤通道,或者端口 1 到 2 用于以太网)。 节点后部的光纤通道端口从左到右编号为 1 到 4。必须在更换节点上以正确的顺序重新连接电缆,以避免向系统中添加更换节点时出现问题。如果未以相同顺序连接电缆,端口标识会发生改变,从而影响到主机访问卷的能力。请参阅特定于您的型号的硬件文档,确定端口是如何进行编号的。
    2. 请勿将更换节点连接到交换机或导向器上的不同端口中。SAN Volume Controller 可以有 4 Gbps 或 8 Gbps HBA。但此时请勿将其移至速度更高的交换机或导向器端口,以避免向系统中添加更换节点时出现问题。这是一项单独的任务,必须独立进行规划,不受在系统中更换节点的影响。
  5. 发出以下 CLI 命令,以从系统和 I/O 组中删除此节点:
    rmnode node_name or node_id

    其中,node_name or node_id 是要删除的节点的名称或标识。可以使用 CLI 来验证删除过程是否完成。

  6. 发出以下 CLI 命令,以确保该节点不再是此系统成员:
    lsnode 
    将显示节点列表。请等待,直到确定命令输出中未列出除去的节点。
  7. 执行以下步骤以将刚刚从系统删除的节点的 WWNN 或 iSCSI 名称更改为 FFFFF:
    对于 SAN Volume Controller V6.1.0 或更高版本:
    1. 打开节点的电源。显示 Cluster 面板时,按向上或向下按钮,直至显示 Actions 选项。
    2. 按下并松开选择按钮。
    3. 按下向上或向下按钮,直至显示“Change WWNN?”。
    4. 按下并松开选择按钮以显示当前 WWNN。
    5. 按下并松开选择按钮以切换到编辑方式。 将显示“Edit WWNN?” 面板。
    6. WWNN 更改为 FFFFF
    7. 按下并松开选择按钮以退出编辑方式。
    8. 按向右按钮以确认选择。将显示“Confirm WWNN?”面板。
    9. 按下并松开选择按钮以确认。
  8. 将更换节点和不间断电源安装到机架中,并连接不间断电源电缆。请参阅 IBM SAN Volume Controller 2145-XXX 型硬件安装指南 《》 《》 《》 《》 ,以确定如何连接节点和不间断电源
    要点: 请勿在此步骤中连接光纤通道或以太网电缆。
  9. 如果是从原有节点中卸下 闪存驱动器 或将其插入到新节点,请参阅 IBM SAN Volume Controller 硬件维护指南 以获取特定指示信息。
  10. 开启更换节点。
  11. 记录更换节点的 WWNN。 如果计划复用所更换的节点,可以使用此名称。
  12. 执行以下步骤,以将更换节点的 WWNN 名称更改为与3 中记录的名称匹配:

    对于 SAN Volume Controller V6.1.0 或更高版本:

    1. 显示 Cluster 面板时,按向上或向下按钮,直至显示 Actions 选项。
    2. 按下并松开选择按钮。
    3. 按下向上或向下按钮,直至显示“Change WWNN?”。
    4. 按下并松开选择按钮以显示当前 WWNN。
    5. 按下选择按钮以切换到编辑方式。将显示“Edit WWNN?” 面板。
    6. 将 WWNN 更改为您在3 步中记录的编号。
    7. 按下并松开选择按钮以退出编辑方式。
    8. 按向右按钮以确认选择。将显示“Confirm WWNN?”面板。
    9. 按下选择按钮以确认。

    等候一分钟。 如果 Cluster: 显示在前面板上,则节点可以添加到系统中。 如果未显示 Cluster:,请参阅故障诊断信息,确定如何解决该问题,也可以联系 IBM 支持中心,再继续下一步操作。

  13. 将光纤通道电缆或以太网电缆连接到您在步骤 4 中为原始节点记录的相同端口号。
  14. 发出以下 CLI 命令,以验证 WWNN 的最后五个字符是否正确:
    lsnodecandidate
    要点: 如果 WWNN 与在3 步中记录的不同,那么必须重复12 步。
  15. 发出以下 CLI 命令以将节点添加到系统,并确保该节点与原始节点具有相同名称且与原始节点位于同一 I/O 组中。请参阅 addnode CLI 命令文档以获取更多信息。
    addnode -wwnodename WWNN -iogrp iogroupname/id 

    WWNNiogroupname/id 是针对原节点记录的值。

    SAN Volume Controller V5.1 和更高版本会通过原先使用的名称,自动重新分配节点。 对于 V5.1 之前的版本,请使用 name 参数和 svctask addnode 命令来分配名称。如果节点的原始名称是由 SAN Volume Controller 自动分配的,那么不能复用相同的名称。如果其名称以 node 开头,则为自动分配的。在这种情况下,请指定不以 node 开头的其他名称,或不使用 name 参数,以便 SAN Volume Controller 能够自动为节点分配新名称。

    如有必要,新节点会更新为与系统相同的 SAN Volume Controller 软件版本。此更新过程可能需要长达 20 分钟的时间。

    要点:
    1. I/O 组中的两个节点均会对数据进行高速缓存;但高速缓存大小是非对称的。更换节点会受到 I/O 组中伙伴节点的高速缓存大小的限制。因此,更换节点不会使用完整的高速缓存大小,直到更换 I/O 组中另一节点。
    2. 无需重新配置主机多路径设备驱动程序,因为更换节点使用与先前节点相同的 WWNN 和 WWPN。多路径设备驱动程序应检测可供更换节点使用的路径的恢复状况。
    3. 主机多路径设备驱动程序需要大约 30 分钟的时间来恢复路径。在成功更新 I/O 组中的第一个节点之后,至少 30 分钟内不要已更新该 I/O 组中的另一个节点。如果在其他 I/O 组中有其他要更新的节点,那么可以在等待的同时对这些节点执行更新
  16. 查询路径可确保在继续执行下一步之前已恢复所有路径。如果使用的是 IBM 多路径子系统设备驱动程序 (SDD),那么用于查询路径的命令为 datapath query device。多路径设备驱动程序随附的文档中显示了如何查询路径。
  17. 修复故障节点。

    如果要将已修复的节点用作备用节点,请执行以下步骤。

    对于 SAN Volume Controller V6.1.0 或更高版本:
    1. 显示 Cluster 面板时,按向上或向下按钮,直至显示 Actions 选项。
    2. 按下并松开选择按钮。
    3. 按下向上或向下按钮,直至显示“Change WWNN?”。
    4. 按下并松开选择按钮以显示当前 WWNN。
    5. 按下并松开选择按钮以切换到编辑方式。 将显示“Edit WWNN?” 面板。
    6. WWNN 更改为 00000
    7. 按下并松开选择按钮以退出编辑方式。
    8. 按向右按钮以确认选择。将显示“Confirm WWNN?”面板。
    9. 按下并松开选择按钮以确认。

    现在,可将该节点用作备用节点。

  18. 请为每个需要更换的节点重复执行317 步。