在不中断运行的情况下将节点更换为 2145-SV1 节点

以下过程描述如何在不中断运行的情况下将大多数节点更换为 SAN Volume Controller 2145-SV1 节点。

开始之前

由于您的网络环境无需更改,因此更换过程不会中断系统运行。更换 2145-SV1 节点将使用与被更换节点相同的全球节点名 (WWNN)。 该过程的备选方法是通过将卷移至新的 I/O 组或者对 SAN 进行重新分组,在不中断运行的情况下更换节点。 但是,中断性过程需要对主机进行更多处理。

在更换节点时,某些系统性能可能会下降。 如果在此过程开始时其中一个节点关闭,那么包含将更换的节点的 I/O 组所管理的卷将降级。 在两个节点运行并访问后端存储器时,将恢复系统性能。

此任务假设满足以下条件。 如果未满足任何条件,请勿继续此任务,除非 IBM® 支持人员指示您这样做。

  • 要点: 确保系统中的所有其他节点正在运行系统软件级别 7.7.1 或更高级别。否则,不会识别用于更换的 2145-SV1 节点。 使用管理 GUI 显示有关系统级别的信息或者输入 lssystem 命令。有关更多信息,请参阅更新系统软件
  • 如果在系统上启用了加密,那么必须在每个新节点上安装新的加密许可证,然后才能将其添加到系统。使用管理 GUI 安装新许可证;有关更多信息,请参阅激活加密许可证
  • 2145-SV1 更换节点必须至少具有与被更换节点一样多的光纤通道、以太网光纤通道 (FCoE) 和以太网端口。
  • 系统中配置的所有节点都存在且处于联机状态。
  • 系统事件日志中的所有错误都已处理并标记为“已纠正”。
  • 卷、受管磁盘 (MDisk) 或外部存储系统不具有已降级脱机状态。
  • 已备份系统配置并保存 svc.config.backup.xml 文件。
  • 2145-SV1 节点支持 4 端口 16 Gbps 光纤通道和 10 Gbps 以太网适配器。 2145-SV1 还可支持适用于 iSCSI 的可选的 2 端口 25 Gbps 以太网适配器(RoCE 或 iWARP)。
  • 将每个光纤通道连接的主机上的光纤通道设备驱动程序设置为使缺失光纤路径在 3 秒钟或更短时间内超时。如果无法检查每个主机上光纤通道驱动程序的参数,那么在向系统添加新的 2145-SV1 节点后,必须立即重新引导该节点。 主机的光纤路径会停止足够长的时间,以确保在 2145-SV1 再次处于活动状态时正确恢复这些光纤路径。
    提示: Emulex 光纤通道设备驱动程序的超时设置可能缺省设置为 30 秒,因此需要更改这个值。
重要说明:
  1. 复查以下所有步骤,再继续执行此任务。 如果不熟悉系统环境或描述的任务,请不要继续执行此过程。
  2. 复查设置光纤通道端口映射: 2145-SV1中的详细信息。 您将需要使用此信息来完成此任务。
  3. 确保 2145-SV1 更换节点至少与将被更换节点具有一样多的 RAM。
  4. 在此任务期间,节点标识可能会更改;节点名称也可能会更改。 在系统分配了节点标识后,无法再更改此标识。 但在此任务完成后,可以更改节点名称。

过程

  1. 确认要更换的节点运行的是软件级别 7.7.1 或更高级别。如果节点运行的不是系统软件级别 7.7.1 或更高级别,那么必须升级系统软件,然后再继续执行此过程。
    您可以使用管理 GUI 来查看和更新软件级别。有关更多信息,请参阅更新系统软件

停止远程拷贝伙伴关系

  1. 为避免维护可能导致的中断,建议停止已连接到要更换的节点的本地和远程系统之间的任何远程拷贝伙伴关系。在停止远程拷贝伙伴关系时,一致性组也将停止。
    1. 要通过输入 CLI 命令来完成此任务,请完成以下步骤:
      1. 输入 lspartnership 命令以显示与要更换的节点相关联的系统的相关信息。然后,记录在命令输出中显示的集群标识。
      2. 通过输入 chpartnership -stop cluster_id 命令(其中 cluster_id 是本地或远程系统的标识)来停止远程拷贝伙伴关系。
      3. 继续至步骤 3
    2. 要使用管理 GUI,请完成以下步骤:
      1. 选择拷贝服务 > 伙伴关系以显示有关要更换的节点的系统信息。
      2. 突出显示相应的系统名称,右键单击该条目,然后选择停止
      3. 在伙伴节点上,重复步骤 3.b.i3.b.ii
      4. 继续至步骤 3

收集有关您正在更换节点的重要信息

  1. 确定要更换节点的标识、名称、I/O 组标识、I/O 组名和系统配置节点状态。

    要确定此信息,可使用管理 GUI 或完成以下步骤。

    1. 从命令行界面发出 lsnode 命令。
      svcinfo lsnode -delim : 
      系统显示了有关当前在系统中所定义节点的信息。
    2. 表 1 中记录 lsnode 命令输出中的信息。 此信息确定节点、节点所属的 I/O 组以及 iSCSI 信息。
      提示: 如果要更换的其中一个节点是系统配置节点 (config_node:yes),请最后进行更换。
      表 1. 有关要更换节点的配置信息
      lsnode 命令输出 lsnodevpd 命令输出
      id name WWNN IO_group_id IO_group_name config_node iscsi_name front_panel_id
                     
                     
                     
                     
    3. 找到要更换节点的前面板标识。使用此标识确定节点的物理位置。
      发出 lsnodevpd 命令(其中 node_name_or_node_id 是节点的名称或标识)。(如果已经知道要更换节点的物理位置,那么可执行下一步。)
      lsnodevpd node_name_or_node_ID
      系统显示了有关节点的详细信息。
    4. 将该值记录在表 1front_panel_id 列中。
  2. 确认没有任何主机依赖于要更换的节点。使用 管理 GUI 或输入命令。
    如果在步骤 3 中使用了 管理 GUI,请完成以下步骤:
    1. 在管理 GUI 中,选择监控 > 系统
    2. 系统 -- 概述页面上,使用节点旁边的方向箭头以展开节点详细信息页面。
    3. 选择节点操作 > 从属卷
    如果在步骤 3 中输入了命令,请输入以下命令(其中 node_name_or_node_id 是节点的名称或标识)。
    lsdependentvdisks -node node_name_or_node_id
    结果显示依赖于该节点的所有卷。
    1. 如果存在从属卷,请确定是否正在使用这些卷。
      如果该卷正在被使用,请恢复冗余配置或者暂挂主机应用程序。
    2. 如果报告了从属定额磁盘,请修复对定额磁盘的访问权或修改定额磁盘配置。
  3. 发出 lsservicestatus 命令以显示有关要更换的节点的光纤通道端口的信息。
    sainfo lsservicestatus
  4. 表 2 中记录每个端口的 fc_io_port_idfc_io_port_WWPN。 添加新节点时,需要此信息来检查端口映射。
    表 2. 有关要更换的节点的光纤通道端口的信息
    lsservicestatus 命令输出
    fc_io_port_id fc_io_port_WWPN
       
       
       
       
  5. 如果在系统上配置了以太网端口 IP 地址,请输入 lsportip 命令以显示当前设置,以便可将其应用于更换节点。
    lsportip -delim :
    系统显示了有关在指定节点上定义的以太网端口的信息。
  6. 表 3 中记录要更换的节点上以太网端口的信息。
    表 3. 有关要更换节点的以太网端口的信息
    lsportip 命令输出
    node_id node_name IP_address subnet_mask IP_address_6 prefix gateway_port_id
                 
                 
                 
                 

从系统卸下节点

如果要使用以太网 RDMA 进行节点间通信,请使用服务助手 GUI 或输入 sainfo lsnodeip 命令来显示当前的节点 IP 设置,以便可将其应用于更换节点。

  1. 在从节点后部卸下电缆之前,使用节点端口号记录并标记光纤通道电缆或以太网电缆的顺序。
    要点: 请勿将更换节点连接到交换机上的其他端口或连接到其他交换机。

    必须在更换节点上以正确的顺序重新连接电缆,以避免向系统中添加更换节点时出现问题。如果未以相同顺序连接电缆,那么端口标识会发生改变。如果端口标识改变,那么主机系统可能无法访问卷。请参阅特定于您的型号的硬件文档,确定端口是如何进行编号的。

  2. 如果节点配置了 10 Gbps 以太网 IP 地址,请通过使用 rmportip 命令删除这些设置,同时确保记录当前设置。
    rmportip -node node_ID_or_name port_ID
  3. 如果在要更换的节点上已激活加密,请输入以下命令来取消激活此功能。
    deactivatefeature feature_id

    发出 lsfeature 命令来确定正确的 license_key 值。有关更多详细信息,请参阅禁用加密功能

  4. 发出 rmnode 命令以从系统和 I/O 组中删除此节点。node_name_or_node_ID 值标识要删除的节点。
    rmnode node_name_or_node_ID
  5. 输入 lsnode 命令以确保该节点不再是此系统成员:
    lsnode
    系统显示了节点的列表。 确保命令输出中未列出卸下的节点,再继续执行下一步。
  6. 可选: 如果要将卸下的节点用作备用节点,请将删除的每个节点的 WWNN 和 iSCSI 名称更改为 1FFFF
    1. 打开节点的电源。
    2. 输入以下 chvpd 命令。
      satask chvpd -wwnn FFFFFFFFFFFFFFFF

准备用于更换的 2145-SV1 节点

  1. 将更换节点安装在机架中。 有关更多信息,请参阅安装 SAN Volume Controller 2145-SV1 硬件
    要点: 请勿在此步骤中连接光纤通道或以太网电缆。
  2. 打开更换节点的电源。
  3. 使用 CAT 5 以太网电缆直接将具有 Web 浏览器的计算机连接到更换节点的技术人员端口。
    1. 如果在计算机上配置了 DHCP,那么在打开新的 Web 页面时,将自动显示安装 GUI。 有关更多信息,请参阅用于访问节点的技术人员端口

      要访问服务助手 GUI,请选择安装 GUI 中的扳手图标。

    2. 如果在计算机上安装了安全 Shell (SSH) 软件,那么还可以通过 192.168.0.1 访问命令行界面。

      然后,以 superuser 身份登录,其中,缺省超级用户密码为 passw0rd

  4. 查找更换 2145-SV1 节点的 WWNN。 此名称可供其他 2145-SV1 节点复用。

    要查找 WWNN,请使用服务助手 GUI 或输入以下命令。

    sainfo lsservicestatus
  5. 针对要更换的节点上定义的每个 FC 端口,在新 2145-SV1 节点中分配 WWNN 和硬件位置。

    要执行此操作,请使用服务助手 GUI 或者输入相应的 chvpd 命令以获取端口映射信息。

    satask chvpd -wwnn wwnn -fcportmap AB-CD,AB-CD,AB-CD,AB-CD
    注: 必须先创建端口映射,然后才可向系统添加新节点。 有关更多信息,请参阅设置光纤通道端口映射: 2145-SV1
    在命令完成时,系统将在用于更换的 2145-SV1 节点上创建新端口映射。 然后,节点将重新引导以应用新设置。
  6. 将光纤通道和以太网电缆连接到更换节点。
  7. 验证 WWNN 的最后 5 个字符是否正确。

    要执行此操作,请使用管理 GUI 或在系统命令行上输入 lsnodecandidate 命令。

    lsnodecandidate
  8. 如果在系统上已激活加密,那么也必须在更换节点上安装并激活加密。要激活此功能,请输入以下命令(其中 key 是加密密钥)。
    activatefeature -licensekey key 

    如果未在新节点上激活许可证,那么您将收到消息 CMMVC8784E。

  9. 输入 lsservicestatus 命令以验证 2145-SV1 节点上的 fc_io_port_idfc_io_port_WWPN 与原始节点的 lsservicestatus 输出中记录的值是否匹配。
    sainfo
    lsservicestatus
    
    1. 如果存在差异,请复查设置光纤通道端口映射: 2145-SV1,并根据需要纠正映射。
    2. 如果值匹配,请将光纤通道或以太网电缆连接到主机适配器。
  10. 如果节点使用以太网 RDMA 与其他节点通信,请使用服务助手工具或 satask chnodeip 命令来设置节点 IP。
  11. 将新 2145-SV1 更换节点添加到系统。 您可使用管理 GUI 或输入 addnode 命令,其中 WWNNiogroup_name_or_id 是为原始节点记录的值。
    addnode -wwnodename WWNN -iogrp iogroup_name_or_id
    请确保新节点具有与原始节点相同的名称,并与原始节点位于同一个 I/O 组中。 请参阅在步骤 3.b表 1 中记录的数据。

    系统使用原先用于被更换节点的名称重新分配 2145-SV1 节点。 如果节点的原始名称是由系统自动分配的,那么不能复用该名称。 如果名称以“node”开头,那么将自动分配。 在这种情况下,请指定不以 node 开头的其他名称,或不使用 name 参数,以便系统能够自动为节点分配新名称。

    要点: 确保系统中的所有其他节点正在运行系统软件级别 7.7.1 或更高级别。否则,不会识别用于更换的 2145-SV1 节点。 有关更多信息,请参阅更新系统软件
  12. 如果先前在被更换节点上配置了以太网 IP 地址,请在新节点上配置以太网端口以复用这些设置。
    可以通过使用 管理 GUIcfgportip 命令配置以太网端口 IP 地址。 指定在步骤 8表 3中记录的相应值。
    • 对于 IPv4 IP 地址
      cfgportip -node node_name_or_node_ID -ip IPv4_addr
      -mask subnet_mask -gw gateway port ID
    • 对于 IPv6 IP 地址
      cfgportip -node node_name_or_node_ID -ip_6 IPv6_addr
      -prefix_6 prefix -gw_6 gateway port ID
    要点:
    1. I/O 组中的两个节点均会对数据进行高速缓存;但高速缓存大小是非对称的。 更换节点会受到 I/O 组中伙伴节点的高速缓存大小的限制。 因此,更换节点不会使用完整的高速缓存大小,直到更换 I/O 组中另一节点。
    2. 无需重新配置主机多路径设备驱动程序,因为更换节点使用与先前节点相同的 WWNN 和 WWPN。 多路径设备驱动程序会检测可供更换节点使用的路径的恢复状况。
    3. 主机多路径设备驱动程序需要大约 30 分钟的时间来恢复路径。 成功更新 I/O 组中的第一个节点后,至少在 30 分钟内不要更新 I/O 组中的其他节点。 如果在其他 I/O 组中有其他要更新的节点,那么可以在等待的同时更新这些节点。
    4. 如果无法检查每个主机的光纤通道设备驱动程序是否设置为使光纤通道路径在 3 秒或更短时间内超时,请立即重新引导新的 2145-SV1 节点,以确保当节点再次激活时激活光纤路径。
  13. 重要 要求主机管理员查询每个主机上的路径,确保更换节点的所有路径处于活动状态,再继续执行下一步。
    如果正在使用 IBM 多路径子系统设备驱动程序 (SDD) ,请输入 datapath query device 命令来查询路径。多路径设备驱动程序随附的文档中显示了如何查询路径。 如果预期路径未处于活动状态,请强制多路径驱动程序重新扫描路径。

重新启动远程拷贝伙伴关系

  1. 完成维护过程时,必须重新启动已停止的远程拷贝伙伴关系。在重新启动远程拷贝伙伴关系时,一致性组也将重新启动。要重新启动远程拷贝伙伴关系,可以输入 CLI 命令或者使用管理 GUI。
    1. 要使用 CLI,请输入 chpartnership start - cluster_id 命令(其中,cluster_id 是本地或远程系统的标识)。
    2. 要使用管理 GUI,请完成以下步骤:
      1. 选择拷贝服务 > 伙伴关系以显示有关被更换节点的系统信息。
      2. 突出显示相应的系统名称,右键单击该条目,然后选择重新启动
      3. 在伙伴节点上重复上述步骤。
  2. 针对更换的每个节点,重复步骤 328