您可以创建增强型延伸系统配置,在该配置中,系统上的每个节点都实际位于不同的站点。 当与镜像技术(如卷镜像或拷贝服务)一起使用时,如果电源发生故障或站点范围内断电,这些配置可用于继续访问系统上的数据。
注: 如果解决方案设计的目标是高可用性,那么最好是使用 IBM®
HyperSwap® 拓扑,而不是增强型延伸系统配置。但是,如果目标包括诸如灾难恢复、复杂拷贝服务或最高可伸缩性之类的主题,请考虑当前 HyperSwap 版本的局限性。有关更多信息,请参阅
规划高可用性。
此处详细介绍了系统拓扑属性设置为延伸的增强型延伸系统配置。在仍受支持的 IBM Knowledge Center 先前版本中描述了几种配置延伸系统的旧方法。通过执行此处提供的最终配置步骤,可以在不中断运行的情况下迁移到最新的增强型延伸系统配置,从而提高可用性和灾难恢复能力。此外,还可以在不中断运行的情况下从延伸系统配置迁移到 HyperSwap 系统配置,从而提高可用性、性能和灾难恢复能力。请联系 IBM 远程技术支持中心,以获取有关更改现有系统拓扑的指导。
在延伸系统配置中,每个站点均定义为独立的故障域。 如果一个站点发生故障,那么另一个站点
可以在不中断的情况下继续运行。 此外,您还必须配置第三个站点来托管定额设备,该设备可在两个主要站点之间可能存在链路故障时自动进行最终判断。 主站点可以位于数据中心内的同一个房间或多个房间内,可以位于同一园区的多个建筑物内,也可以位于不同城市的多个建筑物内。 不同种类的站点用于防止不同类型的故障。
- 多个站点位于单个位置中
- 如果每个站点是单个位置或数据中心内的不同电源相位,那么系统可以幸免于任何单一电源域的故障。 例如,一个节点可位于一个机架安装中,另一个节点可位于另一个机架中。 每个机架都被视为具有各自电源相位的独立站点。 在这种情况下,如果某个机架断电,另一个机架中的伙伴节点可以配置为处理请求,并有效地提供数据可用性,即使由于断电而导致另一个节点脱机也如此。
- 每个站点位于独立位置
- 如果每个站点是不同的物理位置,那么系统可以幸免于任何单一位置故障。 这些站点可以距离较近(例如,同一城市中的两个站点),也可以在地理位置上相距更远(例如,不同城市中的两个站点)。 如果一个站点发生站点范围内的灾难,那么剩余的站点仍可用于处理请求。
如果配置正确,那么系统会在失去一个站点后继续运行。 关键的先决条件是,每个站点仅包含每对节点中的一个节点。 仅为延伸系统配置从不同站点中的同一系统安排一对节点不会提供高可用性。 您还必须配置相应的镜像技术,并确保正确配置这些技术的所有配置需求。
备注: - 在 SAN Volume Controller 2145-DH8
型号中,不建议针对延伸系统使用具有内部闪存驱动器的节点。
- 延伸系统可以与 N_Port 标识虚拟化 (NPIV) 结合使用。 在站点崩溃的情况下,远程站点节点上的光纤通道故障转移端口将打开,
并向光纤网提供来自本地节点的光纤通道主机端口的全球端口名 (WWPN)。 NPIV 使主机能够重新登录这些端口,而不必从多路径驱动程序重新路由。 在此情况下,由于与物理上位于远程站点的端口之间的往返数据传输时间,可能会导致更长的等待时间。
- 必须使用足够的连接配置具有主动/被动控制器(如 IBM DS5000™、IBM DS4000® 和 IBM DS3000 系统)的延伸系统光纤通道配置,以便所有站点都能够直接访问外部存储系统。
对于具有两个或更多主动/被动控制器(如 Storwize® 系列 系统)的 iSCSI 配置,必须使用足够的连接配置系统,以便所有站点都能够直接访问外部存储系统。 只能通过用作活动定额磁盘的 MDisk 的当前所有者来定额访问延伸系统。
您必须配置延伸系统以满足下列需求:
- 在光纤通道连接中,将每个节点直接连接到主站点和辅助站点的两个或更多 SAN 光纤网(支持 2 到 8 个光纤网)。在 iSCSI 连接中,将每个节点连接到主站点和辅助站点的两个或更多以太网光纤网。 将站点定义为独立故障域。 故障域属于边界内的系统,这样该边界内的任何故障(如电源故障、火灾或洪灾)都包含在边界内,并且故障不会传播或影响该边界外的部分。 故障域可以位于数据中心内的同一个房间或多个房间内,可以位于同一园区的多个建筑物内,也可以位于不同城镇的多个建筑物内。 不同种类的故障域可防止发生不同类型的故障。
- 使用第三个站点容纳定额磁盘或 IP 定额应用程序。
在 iSCSI 连接的存储系统上无法找到定额磁盘;因此,无法在第三个站点上配置 iSCSI 存储器。
- 如果在第三个站点上使用存储系统,那么该存储系统必须支持扩展的定额磁盘。 可在以下 Web 站点提供的互操作性矩阵中获取更多信息:
www.ibm.com/support
- 将独立存储系统置于主站点和辅助站点处,并使用卷镜像在这两个站点处的存储系统之间对主机数据执行镜像操作。 如果可以,请将每个卷的首选节点设置为卷所映射到的主机所在站点中的节点。
- 连接可能因光纤类型和小外形规格可插拔 (SFP) 收发器(长波和短波)而异。
- 同一个 I/O 组中相隔超过 100 米(109 码)的节点必须使用长波光纤通道或 iSCSI 连接。 长波小外形规格可插拔 (SFP) 收发器可以作为可选组件购买,必须是以下 Web 站点中所列长波SFP 收发器之一:
www.ibm.com/support
- 避免在节点与外部存储系统之间的路径中使用交换机间链路 (ISL)。 如果无法避免,请勿因 ISL 之间的光纤通道流量大而过度使用 ISL。 对于大多数配置,都需要中继。 由于 ISL 问题难以诊断,因此必须收集交换机端口错误统计信息,并定期监控以检测故障。
- 在第三个站点使用单个交换机可能会导致创建单个光纤网,而不是两个独立的冗余光纤网。 单个光纤网是不受支持的配置。
- 每个节点上的以太网端口 1 必须连接到相同的一个或多个子网。 每个节点的以太网端口 2(如果使用)必须连接到同一个子网(这可能是与端口 1 不同的子网)。 同样的原则也适用于其他以太网端口。
- 某些维护操作需要物理访问系统中的所有节点。 如果延伸系统中的节点相隔超过 100 米,那么维护操作可能需要多个服务人员。 请联系您的服务代表,询问有关多站点支持的信息。
延伸系统将查找第三个站点上的活动定额磁盘或 IP 定额应用程序。 如果主站点和辅助站点之间的通信中断,能够访问活动定额磁盘的站点将继续处理事务。 如果与活动定额磁盘的通信中断,那么另一个站点上的备用定额磁盘可变为活动定额磁盘。
虽然可以将节点系统配置为最多使用三个定额磁盘,但是只可以选择一个定额磁盘来解决系统分区为两组同等大小节点的情况。 其他定额磁盘的目的在于:当定额磁盘对系统进行分区之前发生故障时提供冗余。
图 1 显示了一个延伸系统配置示例。当与
卷镜像一起使用时,该配置将提供可容忍单个站点发生故障的高可用性解决方案。如果主站点或辅助站点发生故障,那么其余站点仍可继续执行 I/O 操作。在该配置中,系统内节点之间的连接相隔超过 100 米,因此必须使用长波
光纤通道连接。
在
图 1 中,使用长波
光纤通道连接将托管第三个站点定额磁盘的存储系统直接连接到主站点和辅助站点上的交换机。如果主站点或辅助站点发生故障,那么必须确保剩下的那个站点仍能直接访问用于托管定额磁盘的存储系统。
限制: 请勿将某个站点中的存储系统 (storage system)直接连接到其他站点中的交换机光纤网。
备用配置可以使用第三个站点中已连接到主站点和辅助站点的另一光纤通道交换机。
只有当托管定额磁盘的存储系统支持扩展定额时,才支持延伸系统配置。虽然可使用其他类型的存储系统来提供定额磁盘,但始终通过单个路径来访问这些定额磁盘。
对于定额磁盘配置需求,请参阅技术说明 Guidance
for Identifying and Changing Managed Disks Assigned as Quorum Disk
Candidates。
在延伸系统配置中设置镜像卷时,请考虑是否要将镜像写优先级设置为 redundancy,以便在写操作完成过程中通过临时延迟来保持拷贝同步。有关更多详细信息,请参阅与镜像卷相关的信息。
延伸系统和高速镜像或全局镜像
延伸系统设计为在断开一个故障域之后继续运行。
延伸系统不能保证在两个故障域发生故障之后仍能运行。
如果配置了增强型延伸系统功能,那么可以针对此情况启用手动覆盖。您还可以在第二个系统上使用高速镜像或全局镜像来对增强型延伸系统或传统延伸系统进行扩展灾难恢复。采用与其他远程拷贝关系相同的方法配置和管理包含延伸系统的高速镜像或全局镜像伙伴关系。
系统支持将 SAN 路由技术(包括 FCIP 链路)用于使用高速镜像或全局镜像的系统间连接。
两个合作系统不能位于同一生产站点上。但是,它们可以与为延伸系统提供活动定额磁盘的存储系统并置。
配置步骤
可以使用命令行界面 (CLI) 或
管理 GUI 来完成这些额外的配置步骤。
- 必须将系统中的每个 节点都分配到一个站点。使用 chnode CLI 命令。如果将额外节点连接到系统,可以将这些节点指定为热备用节点。热备用节点可以在站点上的任何节点不可用时无中断地接管主机 I/O 操作。有关更多信息,请参阅有关添加热备用节点的主题。
- 必须将每个后端存储系统都分配到一个站点。使用 chcontroller CLI 命令。
- 必须将每个主机都分配到一个站点。使用 chhost CLI 命令
- 将所有节点、主机和存储系统都分配到站点后,必须通过将系统拓扑更改为 stretched 来启用增强型方式。
- 为获得最佳结果,请将增强型延伸系统配置为至少包含两个 I/O 组(四个节点)。仅有一个 I/O 组的系统无法保证在发生节点故障或系统更新的情况下维护数据镜像或不间断主机访问。
延伸系统无法保证其在两个故障域发生故障之后仍可运行。如果配置了增强型延伸系统功能,那么可以针对此情况启用手动覆盖。您还可以在第二个系统上对增强型延伸系统或传统延伸系统使用高速镜像或全局镜像以进行扩展灾难恢复。采用与其他远程拷贝关系相同的方法配置和管理包含延伸系统的高速镜像或全局镜像伙伴关系。
该系统支持将 SAN 路由技术(包括 FCIP 链路)用于使用高速镜像或全局镜像的系统间连接。