更新系统

系统更新过程包括更新整个系统环境。

在此处开始从 V7.7.0 或更高版本更新到 V8.1.0 或更高版本。

如果要从 V7.7.0 之前的发行版进行更新,请遵循此前发行版中的指示信息。

注意: 如果在更新过程期间,任何节点发生内存 DIMM 故障,请立即停止。 请遵循以下过程来确保成功更新
  1. 更换故障节点上的 DIMM。
  2. 从系统中卸下具有 DIMM 故障的节点:
    svctask rmnode object_id | object_name
  3. 检查系统中其余节点的状态和更新状态:
    svcinfo lssoftwareupgradestatus
  4. 如果伙伴节点启动并且系统更新状态为 updating,那么在维护方式下更新节点并将其重新添加到系统中:
    svctask addnode
    请参阅 addnode 命令信息,以获取可能的标记。 更新继续。
  5. 如果伙伴节点启动并且系统更新状态为 stalled,那么决定完成更新(前滚)还是取消(回滚)。 您的决定一部分基于出现故障时更新的程度。 您可以通过服务更新策略或节点除去(rmnode 命令)前滚。
    • 前滚(服务更新):要手动完成更新,请使用维护方式更新过程来更新其余下级节点。 所有节点都运行同一级别后,将落实更新
    • 前滚(rmnode 命令):仅当更新已完成 50% 或 50% 以上时,使用 rmnode 命令过程。
    • 回滚(取消更新):
       svctask applysoftware -abort -force
      如果一个或多个节点脱机,那么需要 -force 参数。
      要点: 使用 -force 参数可能会导致失去访问。 仅当伙伴节点(您脱机节点的)处于原始代码级别时,选择此选项。
      已更新节点回滚至原始软件级别,一次一个节点。
  6. 验证所有节点是否都已回滚并运行相同固件。
  7. 输入下列命令:
    svcconfig backup
  8. 验证系统的运行状况。

有关更新前的限制的最新信息,请访问下面的站点:

http://www.ibm.com/support/docview.wss?uid=ssg1S1001707

请预留最多一周的时间,用于制订任务计划、完成更新的预备任务,以及完成系统环境的更新更新过程可以分为以下常规过程,如表 1 所示。
表 1. 更新任务
顺序 更新task
1 更新前,请熟悉所涉及的先决条件和任务。 在自动更新过程中,集群系统会有计划地更新所有节点。 确定希望自动更新还是手动更新。 在自动更新过程中,集群系统 (clustered system)会系统化地更新各节点。 自动方法是在节点上更新 软件 的首选过程。 但是,也可以手动更新每个节点。
2 确保 CIM 对象管理器 (CIMOM) 客户机工作正常。 必要时,更新这些客户机,以便其能够支持新版本的系统代码。
3 确保该环境中的多路径驱动程序是完全冗余的。
4 更新系统。 系统更新包含组件固件更新。 驱动器固件更新是一个单独的过程。
5 更新系统环境中的其他设备。例如,将主机和交换机更新至正确的级别。
注: 所需时间取决于所需的准备工作量以及环境大小。 对于自动更新,每个节点需要 20 分钟,外加每个系统需要 30 分钟。 为多路径软件提供 30 分钟时间间隔以便其进行恢复。
注意: 如果使用多路径驱动程序支持时遇到故障转移问题,请先解决这些问题,然后再开始正常操作。

系统及其连接的适配器的固件和软件 将作为单个软件包进行测试和发布。 每次发布新的版本,软件包的编号都会增加。

一些代码级别仅支持从特定的先前级别更新,或者该代码只能在特定硬件类型上安装。 如果要更新到当前级别以上的多个级别,那么可能需要安装中间级别。 例如,如果您是从级别 1 更新到级别 3,那么可能需要安装级别 2,然后才能安装级别 3。有关每个代码级别的先决条件的更多信息,请访问以下 Web 站点:

www.ibm.com/support
注意: 确保日志中不存在未修复的错误,并且正确设置了系统的日期和时间。 启动修复过程,并且确保在尝试并发更新代码之前修复所有未解决的错误。
注: 系统软件更新完成之后, 即可按照使用 管理 GUI 时的事件修复过程,在每个节点上启用以太网光纤通道 (FCoE) 功能。 FCoE 激活过程涉及节点重新引导。 为实现主机多路径预留时间,以在同一 I/O 组中不同节点的激活间隔时间内进行恢复。

更新过程

在自动更新过程中,系统中的每个节点逐个进行已更新,新代码在各个节点上分阶段执行。 在每个节点重新启动时,系统所维持的最高 I/O 速率可能会有所下降。 在系统中的所有节点都以新代码级别成功重新启动后,将会自动落实新级别。

在自动代码更新期间,工作对的各节点会顺序已更新。 正在已更新的节点会临时不可用,并且所有针对该节点的 I/O 操作失败。 因此,I/O 错误计数增加,失败的 I/O 操作将转移至工作对的伙伴节点。 应用程序不会看到任何 I/O 失败。 将新节点添加到系统时,更新软件包会自动下载到系统中的新节点。

通常,更新可以与正常的用户 I/O 操作同时进行。 但是,可能会影响性能。 如果对更新期间可执行的操作有任何限制,将会在用于下载更新软件包的产品 Web 站点上记录这些限制。 在更新过程中,大多数配置命令都不可用。 从更新过程启动到落实新代码级别,或者直至回退该过程,仅以下命令可运行:

  • 所有 information 命令
  • rmnode 命令

要确定更新过程何时完成,您将通过管理 GUI 收到通知。 如果使用命令行界面,请发出 lsupdate 命令以显示更新状态。

由于更新过程中出现的一些操作限制,因此代码更新由用户完成。 然而,如果您对更新有疑问,请联系支持中心。 在没有技术协助的情况下,请勿尝试对更新问题进行故障诊断。 如要获取更多指导,请参阅有关如何获取信息、帮助和技术协助的主题。

多路径驱动程序

更新之前,请确保多路径驱动程序是完全冗余的,并且每条路径均可用且联机。 您可能会看到与路径相关的错误消息(故障转移),并且在更新期间错误数量不断增加。 在节点路径恢复后,节点会回退成为完全冗余的系统。 30 分钟的延迟后,到其他节点的路径会下调。

如果将 IBM® 子系统设备驱动程序 (SDD)IBM 子系统设备驱动程序设备特定模块 (SDDDSM) 用作主机上的多路径软件,那么通过 datapath query devicedatapath query adapter 命令可显示增加的 I/O 错误计数,以监控多路径软件的状态。 有关更多信息,请参阅 IBM 多路径子系统设备驱动程序 用户指南》,以获取关于 datapath query 命令的更多信息。

如果将 IBM 子系统设备驱动程序路径控制模块 (SDDPCM) 用作主机上的多路径软件,那么通过 pcmpath query devicepcmpath query adapter 命令可显示增加的 I/O 错误计数,以监控多路径软件的状态。

高速镜像全局镜像关系

如果更新软件所在的系统上具有运行高速镜像或全局镜像关系的辅助卷,主卷上的写操作性能可能会下降,全局镜像关系可能会自动停止,并显示包含错误代码为 1920 的一个或多个错误。 您可能希望在更新软件前主动停止这些关系,以避免写操作性能下降,并希望在完成更新后重新启动这些关系。

在系统 V6.4.0 或更高版本中,已启用对四个光纤通道和两个以太网光纤通道 (FCoE) 端口的支持。 如果系统包含这些软件版本,那么无法与运行低于 V6.4.0 的软件版本的另一系统建立远程拷贝伙伴关系。 如果运行 6.4.0 或更高版本的系统与运行较低软件版本的另一系统具有现有的远程拷贝伙伴关系,那么无法添加光纤通道和 FCoE 端口总数超过 4 个的节点。 同时您还不能激活系统中现有节点上的更多端口(无论是通过启用 FCoE 还是安装新硬件)。 要解决这些问题,您有以下两种选择:
  • 将远程系统上的软件更新至 6.4.0 或更高版本,或者
  • 使用 chnodehw -legacy CLI 命令禁用安装了 6.4.0 或更高软件版本的系统中节点上的额外硬件
chnodehw CLI 的 -legacy 参数控制激活和取消激活 FCoE 端口。
要激活额外硬件,请运行以下 CLI 命令:
chnodehw node id
其中 node_name | node_id(必需)指定要修改的节点。 参数后的变量可以是:
  • 将节点添加到系统时分配的节点名。
  • 分配给节点的节点标识(不是全球节点名)。
要禁用额外硬件,请运行以下命令:
chnodehw -legacy software_level node_id
其中 software_level 指示节点必须与其相互操作的软件级别。 如果该值低于 6.4.0,那么该节点会将其硬件配置为仅支持最多 4 个光纤通道或 FCoE 端口。 node_name | node_id(必需)指定要修改的节点。 参数后的变量可以是:
  • 将节点添加到系统时分配的节点名
  • 分配给节点的节点标识(非全球节点名)
由于在代码为 6.4.0 的每个节点上支持 6 个端口(4 个光纤通道和 2 个 FCoE 端口),规则规定如何设置与低于 6.4.0 的系统的伙伴关系。
  • 6.4.0 系统无法与低于 6.4.0 并启用了 4 个以上 FC/FCoE I/O 端口的系统形成伙伴关系。
    例如,A、B 和 C 三个系统之间的多系统伙伴关系配置。
    A <-> B<-> C
    系统 A 安装了低于 6.4.0 的版本,而系统 B 和 C 安装了 6.4.0 版本。
    在这种配置中,只有在系统 B 没有启用 FCoE 端口的情况下才可能执行远程拷贝服务。
    系统 A 和 B 之间的伙伴关系将不受影响,因为系统 C 的节点上激活了 FCoE 端口。
  • 如果 6.4.0 系统已建立与低于 6.4.0 系统的伙伴关系,并且如果在停止伙伴关系时启用了更多硬件(4 个光纤通道和两个 FCoE 端口),那么在已更新远程系统或使用 chnodehw -legacy 命令禁用额外的硬件之前,将无法再次启动该伙伴关系。
  • 采用较旧硬件配置的节点(包括已从 6.3.0 已更新到 6.4.0 且具有 10 Gb 以太网适配器的系统)可能会生成事件日志,用于指示新硬件(FCoE 功能)可用并应该使用 chnodehw 命令进行启用。 如果要继续运行与使用较旧级别软件的系统的远程拷贝伙伴关系,请勿修改本事件日志。

如果激活了额外的硬件,并且需要与运行低于 6.4 的软件的系统建立伙伴关系,那么必须首先使用 chnodehw -legacy software version (pre 6.4) node id 命令禁用额外的硬件。

将节点添加到系统之后,系统将会检查(已启动的)伙伴关系并确定合作系统的最低软件级别。 该软件级别将传递到要添加至系统的节点。 该节点在加入系统时将会执行 chnodehw -legacy software level 的等效命令。

在系统更新后

更新前位于系统上的审计日志内容将发送到配置节点上的 /dumps/audit 目录中的文件。 审计日志现在将包含成功更新系统后运行的命令产生的内容。