延伸系统或 HyperSwap 系统中的手动定额覆盖
发生滚动式灾难时,需要手动定额磁盘覆盖。在少数情况下,系统受到称为滚动式灾难的事件的影响。 当事件范围较广时会发生滚动式灾难,并且其影响波及很长时间段内的多个步骤。 以下示例场景描述了滚动式灾难并演示如何从该滚动式灾难恢复。
此示例将第二个站点保留为可能是能够继续执行数据 I/O 的唯一站点;但是,直到该站点获得定额设备的控制权之后,才能这样做。第二个站点中的 MDisk 将停止。 站点中的节点将显示节点错误 551,以指示没有足够的节点数可用于构成延伸系统或 HyperSwap® 系统配置中的定额磁盘。
- 为确保系统在使用之前处于正确状态,只能在支持人员的帮助下运行 quorum override 命令。
- 如果在运行 quorum override 命令时光纤网损坏,那么很可能节点的子集将更新其系统标识。已更新的节点显示节点错误 550。未更新的节点显示错误 551,这些节点将分配到两个不同系统。在此情况下,您可以对报告错误 551 的其中一个节点再次运行 quorum override 命令。此命令会更新具有新集群(系统)标识的两个系统中的所有节点。 然后,您可以恢复数据。
定额磁盘的强制执行条件
必须在系统安装过程中运行 chsystem -topology stretched 或 chsystem -topology hyperswap 命令,以使 quorum override 命令在发生滚动式灾难的情况下可用。The quorum override 命令在未将拓扑设置为 stretched 或 hyperswap 的系统中不可用。在您可以使用此命令之前,必须满足以下先决条件:
- 具有两个节点的所有 I/O 组将通过站点 1 中一个节点和站点 2 中另一个节点进行分配。
- 具有 MDisk 的所有存储系统必须具有已定义的站点。
当满足这些先决条件并且启用了自动定额设备选择时,系统会尝试在全部三个站点内分配一个定额设备。如果某个站点中没有适合于定额设备的 MDisk,那么不会对该站点分配定额设备。
也不允许将站点设置用于节点。 需要此强制措施以确保系统正确运行,从而正确运行 quorum override 命令。
当您运行 chsystem -topology standard 命令时,可重新变更节点和控制器的站点设置。 但是,此命令会禁用覆盖定额功能。 因此,当您完成更改以重新启用此支持之后,要运行 chsystem -topology stretched 或 chsystem -topology hyperswap。