MAP 5350:关闭节点电源

MAP 5350:关闭节点电源有助于关闭单个节点电源,以完成服务操作而不中断主机对卷的访问。

开始之前

如果已正确设置解决方案,那么关闭单个节点电源不会中断系统的正常运行。系统具有成对的节点,称为 I/O 组。 I/O 组在仅有单个节点打开电源的情况下继续处理其管理的磁盘的 I/O。但是,性能会降级并减少错误的恢复能力。

关闭系统节点电源时须加注意,以免对系统造成不必要的影响。
注: 如果不遵循此处概述的过程,那么应用程序主机可能会失去对其数据的访问权,最坏情况下可能会丢失数据。
可以使用以下首选方法关闭属于系统成员且未脱机的节点的电源:
  1. 使用管理 GUI 或服务助手界面中的关闭电源选项。
  2. 使用 CLI 命令 stopsystem –node name

首选使用管理 GUI 或命令行界面 (CLI) 来关闭节点电源。这些方法提供到伙伴节点的控制切换,并且向系统中的其他故障提供更好的恢复能力。

仅在节点脱机或不是系统成员的情况下,才必须使用电源按钮关闭其电源。

关于此任务

要在关闭节点电源时尽量减少中断情况,必须符合以下所有条件:
  • I/O 组中的另一个节点已打开电源并在系统中处于活动状态。
  • I/O 组中的另一个节点与该 I/O 组管理的所有主机和磁盘控制器都具有 SAN 光纤通道连接。
  • 此 I/O 组处理的所有卷都处于联机状态。
  • I/O 组中另一个节点的主机多路径处于联机状态。

在某些情况下,您关闭节点电源的原因可能无法满足这些条件。例如,如果更换发生故障的光纤通道适配器,那么卷不显示联机状态。请自行判断决定在未满足条件时继续操作是否安全。在继续执行可能中断 I/O 访问的关闭电源操作之前,请始终与系统管理员核实。系统管理员可能倾向于等待更合适的时间或暂挂主机应用程序。

为确保平稳重新启动,节点必须将其无法重新创建的数据结构保存到其本地内部磁盘驱动器。节点保存到本地磁盘的数据量可能非常高,因此此操作可能会花费几分钟时间。请勿尝试中断受控电源关闭。

注意: 以下操作不允许节点将数据保存到其本地磁盘。因此,请勿使用以下方法关闭节点电源:
  • 按住节点(除非是 SAN Volume Controller 2145-SV1 )上的电源按钮。

    按压并松开电源按钮时,节点会向软件指示此操作,因此节点可以在节点电源关闭之前将其数据写入到本地磁盘。

    按住电源按钮时,硬件将此操作解释为紧急电源关闭指示并立即关闭。硬件在断电之前不会将数据保存到本地磁盘。在按住电源按钮后约 4 秒钟,会发生紧急电源关闭。

  • 按光通路诊断面板上的重置按钮。
要点: 如果关闭 SAN Volume Controller 2145-DH8 节点电源,并且当天可能不会重新打开其电源,请遵循以下步骤,以防止在节点连接到电源但未打开电源时电池过度放电:
  1. 将两个电池均从节点中拉出。将其一直放在外面,直至您准备好打开节点电源为止。
  2. 将电池推入,然后按电源按钮以打开节点电源。
如果从 SAN Volume Controller 2145-DH8 节点断开电源连接,并且在未来 24 小时内可能不会再次将电源与其重新连接,请遵循以下步骤,以防止在节点未连接到电源时电池过度放电:
  1. 从节点断开两条电源线连接后,将两个电池从节点中拉出。此步骤会完全关闭电池底板。
  2. 再次将电池重新推入。

使用管理 GUI 关闭系统电源

使用管理 GUI 关闭系统电源。

过程

要使用管理 GUI 关闭系统电源,请完成以下步骤:

  1. 启动您正在维护的系统的管理 GUI
  2. 选择监控 > 系统

    如果要关闭电源的节点显示为 Offline,那么表明节点没有参与系统。在此类情况下,请使用脱机节点上的电源按钮关闭节点电源。

    如果要关闭电源的节点显示为 Online,那么关闭节点电源可能导致其从属卷也脱机:

    1. 选择节点,然后单击显示从属卷
    2. 确保 I/O 组中每个卷的状态为 Online。您可能需要查看多个页面。 您可能需要查看多个页面。

      如果任何卷的状态为 Degraded,那么表明 I/O 中仅有一个节点在处理该卷的 I/O 请求。 如果该节点已关闭电源,那么它会影响正在将 I/O 请求提交到已降级卷的所有主机。

      如果任何卷已降级,并且您认为这可能是因为 I/O 组中的伙伴节点最近已关闭电源,请等待直至屏幕刷新,显示所有卷都处于联机状态。所有卷在伙伴节点关闭电源的 30 分钟内都必须处于联机状态。

      注: 等待 30 分钟后,如果卷已降级并且所有关联节点和 MDisk 都处于联机状态,请联系支持人员以获取帮助。

      继续之前,请确保主机使用的所有卷都处于联机状态。

    3. 如有可能,检查所有访问此 I/O 组管理的卷的主机是否能够故障转移,以使用该组中另一个节点提供的路径。

      使用主机系统的多路径设备驱动程序软件完成此检查。根据使用的多路径设备驱动程序,要使用的命令有所不同。

      如果使用 System Storage® 多路径子系统设备驱动程序 (SDD),那么用于查询路径的命令为 datapath query device

      多路径设备驱动程序在打开节点电源后重新发现路径可能会花费一些时间。如果您无法在主机上检查 I/O 组中两个节点的所有路径是否都可用,请勿在伙伴节点打开电源的 30 分钟内关闭节点电源,否则可能会失去对卷的访问权。

    4. 如果您决定可以继续关闭节点电源,请选择要关闭电源的节点,然后单击关闭系统
    5. 单击确定。 如果选择的节点是提供卷访问权的最后一个剩余节点(例如,包含具有非镜像卷的闪存驱动器的节点),那么会显示“强制关闭节点”面板,其中列出在关闭节点的情况下将脱机的卷。
    6. 检查没有主机应用程序访问正在脱机的卷。仅在可接受失去这些卷的访问权的情况下才继续关闭。要继续关闭节点,请单击强制关闭

下一步做什么

在关闭过程中,节点将其数据结构保存到其本地磁盘,并且将缓存中保存的所有写数据离台到 SAN 磁盘。此类处理需要几分钟时间。

在此处理结束时,系统电源关闭。

使用系统 CLI 关闭节点电源

使用命令行界面 (CLI) 关闭节点电源。

过程

  1. 发出 lsnode CLI 命令以显示系统中的节点及其属性的列表。查找要关闭的节点并写下其 I/O 组的名称。确认 I/O 组中的另一个节点状态为 online
    lsnode -delim :
    id:name:UPS_serial_number:WWNN:status:IO_group_id: IO_group_name:config_node:
    UPS_unique_id
    1:group1node1:10L3ASH:500507680100002C:online:0:io_grp0:yes:202381001C0D18D8
    2:group1node2:10L3ANF:5005076801000009:online:0:io_grp0:no:202381001C0D1796 
    3:group2node1:10L3ASH:5005076801000001:online:1:io_grp1:no:202381001C0D18D8 
    4:group2node2:10L3ANF:50050768010000F4:online:1:io_grp1:no:202381001C0D1796

    如果要关闭电源的节点显示为 Offline,那么表明节点没有参与系统,并且未在处理 I/O 请求。在此类情况下,请使用节点上的电源按钮关闭节点电源。

    如果要关闭电源的节点显示为 Online,但是 I/O 组中的另一个节点未联机,那么关闭节点电源会影响所有正在将 I/O 请求提交到 I/O 组管理的卷的主机。继续之前,请确保 I/O 组中的另一个节点处于联机状态。

  2. 发出 lsdependentvdisks CLI 命令以列出依赖于指定节点状态的卷。
    lsdependentvdisks group1node1
    
    vdisk_id       vdisk_name0 vdisk0
    1 vdisk1

    如果节点脱机或从系统中移除,那么从属卷也会脱机。在使节点脱机或将其从系统中移除之前,可以使用该命令来确保您不会失去对任何卷的访问权。

  3. 如果您决定继续关闭节点电源,请输入 stopsystem –node <name> CLI 命令来关闭节点电源。使用 –node 参数避免关闭整个系统的电源:
    stopsystem –node group1node1
    Are you sure that you want to continue with the shut down? yes
    注: 要关闭节点(即使有从属卷也如此),请向 stopsystem 命令中添加 -force 参数。即便任何非独立卷被脱机,force 参数也能强制命令的连续性。 请谨慎使用 force 参数;对非独立卷上的数据的访问将会丢失。

    在关闭过程中,节点将其数据结构保存到其本地磁盘,并且将缓存中保存的所有写数据离台到 SAN 磁盘,这可能需要几分钟时间。

    在此过程结束时,节点电源关闭。

使用系统电源控制按钮

除非存在紧急情况或其他过程引导您操作,否则请勿使用电源控制按钮来关闭节点电源。

开始之前

通过此方法,无法从前面板检查系统状态,因此无法分辨关闭电源是否会对系统造成过多中断。请改用先前主题中描述的管理 GUI 或 CLI 命令关闭活动节点的电源。

关于此任务

如果必须使用此方法,请注意在 图 1图 2 中每个型号类型的前部都有一个电源控制按钮  1 

图 1. SAN Volume Controller 2145-DH8 型号上的电 源控制按钮
2145-DH8 型号上的电源控制按钮
图 2. SAN Volume Controller 2145-SV1 型号上的电源控制按钮 和指示灯
SAN Volume Controller 2145-SV1
 型号上的电源控制按钮
  •  1  电源控制按钮和供电指示灯
  •  2  识别指示灯
  •  3  节点状态指示灯
  •  4  节点故障指示灯
  •  5  电池状态指示灯

当确定可安全执行此操作时,按下并立即松开电源按钮。在除 2145-DH82145-SV1 以外的型号上,前面板显示屏更改为显示 Powering Off 并显示进度条。

注: 2145-DH82145-SV1 没有前面板显示屏,但 图 2 中的状态指示灯  2  3  4  5  全部关闭,且电源指示灯  1  从点亮变为闪烁。

结果

节点在关闭电源的同时将其数据结构保存到磁盘。关闭电源过程可能最多需要五分钟。

当使用电源按钮(或由于电源故障)关闭节点电源时,其 I/O 组中的伙伴节点立即停止使用其缓存新增写数据,并且将其缓存中已有的任何写数据离台到 SAN 连接的磁盘。

离台持续时间取决于磁盘控制器的速度和利用率。完成时间不到 15 分钟,但是此过程可能需要更长时间。如果有数据在等待写入到处于脱机状态的磁盘,那么离台无法完成。

在其伙伴节点继续处理 I/O 时关闭电源并重新启动的节点可能无法立即成为 I/O 组的活动成员。 节点必须等待直至伙伴节点完成缓存的离台为止。

如果伙伴节点在此期间关闭电源,那么会失去对此 I/O 组管理的 SAN 存储器的访问权。 如果 I/O 组中的其中一个节点无法为任何 I/O 提供服务,那么该 I/O 组管理的卷的状态为 Degraded。例如,如果 I/O 组中的伙伴节点仍在清空其写缓存,它将具有状态 Degraded