配置定额
如果发生 SAN 故障,此时恰好存在先前属于系统的一半节点,那么将使用定额设备来做出仲裁。定额设备还用于存储重要系统配置数据的备份副本。为此,将在每个定额设备上保留比 256 MB 稍多一点的空间。
可将系统分为两组,每组均包含系统中原来一半数量的节点。 定额设备确定哪组节点停止运行并停止处理 I/O 请求。在这种仲裁情况下,访问定额设备的第一组节点会标记为定额设备的所有者,因而可以继续作为系统运行,并处理所有 I/O 请求。如果另一组节点无法访问定额设备,或者发现定额设备由另一组节点所拥有,那么该组节点将停止作为系统运行,并且不会处理 I/O 请求。
每个系统只能拥有一个在仲裁情况下使用的活动定额设备。但是,系统最多使用三个定额设备来记录在发生灾难时要使用的系统配置数据的备份。系统自动选择一个定额设备作为活动定额设备。可通过使用带有 active 参数的命令行界面 (CLI) 命令 chquorum 来指定活动的定额设备。 要查看当前的定额设备状态,请使用 lsquorum 命令。在将系统分区之前,其他定额设备用于在活动定额设备发生故障时提供冗余。为了避免在单次故障中失去所有定额设备的可能性,请在多个存储系统上分配候选定额磁盘或者在多个服务器上运行 IP 定额应用程序。
单站点配置
在未将系统配置为延伸或 HyperSwap 系统时,正常配置使用受管驱动器或 MDisk 作为定额设备。系统自动分配候选定额磁盘。但是,向系统添加新存储器或除去现有存储器时,最好是查看定额磁盘分配情况。(可选)可将 IP 定额设备配置为使用定额磁盘的替代方法或者提供额外的冗余。
延伸或 HyperSwap 配置
要提供保护,防止出现影响整个站点的故障(如断电),可以使用将单一系统能够拆分到三个物理位置的配置。
延伸或 HyperSwap 系统在两个站点之间划分系统节点。如果 SAN 故障导致站点间连接中断或者故障导致某个站点范围停运,那么定额配置将确定哪个站点继续运行并处理 I/O 请求。高可用性解决方案在第三个站点上配置了活动定额设备,因此在任何单站点故障后,系统将继续运行。
在第三个站点上使用 IP 定额应用程序时,您可以配置首选项,即在两个站点之间的连接中断时哪个站点继续运行。如果只有一个站点运行关键性应用程序,那么可将此站点配置为首选。如果配置了首选站点并且故障导致首选站点停运,那么另一个站点获胜并继续运行和处理 I/O 请求。
可以在第三个站点上配置无定额设备的延伸或 HyperSwap 系统。如果没有第三个站点,那么必须将定额配置为选择一个站点以总是赢得仲裁。如果站点之间的连接中断,那么配置为获胜者的站点将继续运行并处理 I/O 请求,而另一个站点将停止直至修复故障。 如果在获胜站点上发生站点停运,那么系统将停止处理 I/O 请求,直至此站点恢复或者使用手动定额覆盖过程。
- 站点 1:半数的系统节点 + 一个或两个定额设备
- 站点 2:半数的系统节点 + 一个定额设备