Detalhes de configuração do sistema estendido

É possível criar uma configuração do sistema estendido aprimorado em que cada nó no sistema está fisicamente localizado em um site diferente. Quando usado com tecnologias de espelhamento, como espelhamento de volume ou Copy Services, essas configurações podem ser usadas para manter acesso aos dados no sistema, no caso de falhas de energia ou indisponibilidades em todo o local.

Nota: Se o objetivo de seu design de solução for a alta disponibilidade, será melhor usar uma topologia IBM® HyperSwap em vez de uma configuração de sistema estendido aprimorada. No entanto, se os objetivos incluem tópicos como recuperação de desastre, Serviços de Cópia complexos ou escalabilidade mais alta, considere as restrições da versão atual do HyperSwap. Para obter mais informações, consulte Planejando alta disponibilidade.

A configuração do sistema estendido aprimorada com o atributo de topologia do sistema configurado como estendido é detalhada aqui. Maneiras mais antigas de configurar um sistema estendido são descritas em versões anteriores do IBM Knowledge Center ainda suportadas. É possível trocar de forma não disruptiva para a configuração do sistema estendido aprimorada atual seguindo as etapas finais de configuração apresentadas aqui de modo a obter melhor disponibilidade e recuperação de desastre. Também é possível mover sem interrupção da configuração do sistema estendido para a configuração do sistema do HyperSwap para obter disponibilidade, desempenho e recuperação de desastre ainda melhores. Entre em contato como o Centro de suporte técnico remoto IBM para obter orientação sobre a mudança de topologia de um sistema existente.

Em uma configuração de sistema estendido, cada site é definido como um domínio de falha independente. Se um site tiver uma falha, o outro site pode continuar a operar sem interrupção. Você também deve configurar um terceiro local para hospedar um dispositivo de quorum que forneça um desempate automático no caso de uma potencial falha de ligação entre os dois locais restantes. O local principal pode estar no mesmo espaço ou em espaços diferentes no datacenter, em prédios no mesmo campus ou em prédios em cidades diferentes. Tipos diferentes de sites protegem contra tipos diferentes de falhas.
Os locais estão em uma única localização
Se cada site for uma fase de energia diferente dentro de um único local ou datacenter, o sistema poderá sobreviver à falha de qualquer domínio de energia único. Por exemplo, um nó pode ser colocado em uma instalação de rack e o outro nó pode estar em outro rack. Cada rack é considerado um site separado com sua própria fase de energia. Neste caso, se a energia fosse perdida para um dos racks, o nó do parceiro no outro rack poderia ser configurado para processar solicitações e fornecer eficazmente disponibilidade para os dados, mesmo quando o outro estiver offline devido a uma interrupção de energia.
Cada local está em localizações separadas
Se cada site for um local físico diferente, o sistema poderá sobreviver à falha de qualquer local único. Esses sites podem abranger distâncias mais curtas, por exemplo, dois sites na mesma cidade, ou podem estar dispersos mais longe geograficamente, como dois sites em cidades separadas. Se um site sofrer um desastre que abrange todo o site, o site restante poderá permanecer disponível para processar solicitações.
Se configurado adequadamente, o sistema continuará operando após a perda de um site. O pré-requisito chave é que cada site contenha somente um nó de cada par de nós. Simplesmente colocar um par de nós do mesmo sistema em sites diferentes para uma configuração de sistema estendido não fornece alta disponibilidade. Deve-se também configurar a tecnologia de espelhamento apropriada e assegurar que todos os requisitos de configuração para essas tecnologias sejam definidos adequadamente.
Observações:
  • Sistemas estendidos podem ser utilizados com Virtualização de ID da Porta N (NPIV). Em uma perda de site, as portas de failover de Fibre Channel nos nós do site remoto se abrem e apresentam para a malha os nomes da porta universal (WWPNs) das portas do host Fibre Channel dos nós locais. A NPIV permite que os hosts efetuem login novamente com essas portas sem precisar rotear novamente a partir do driver de caminhos múltiplos. Nesse caso, mais latência pode ser introduzida pelo tempo de trânsito de dados de roundtrip com as portas que estão fisicamente no site remoto.
  • As configurações Fibre Channel de sistema estendido com controladores ativos/passivos, como sistemas IBM DS5000, IBM DS4000 e IBM DS3000, devem ser definidas com conexões suficientes para que todos os sites tenham acesso direto aos dois sistemas de armazenamento externo. Para configurações iSCSI com dois ou mais controladores ativo/passivo, tais como sistemas Família Storwize, os sistemas deverão ser configurados com conexões suficientes, de modo que todos os sites tenham acesso direto a ambos os sistemas de armazenamento externo. O acesso ao quorum para o sistema estendido é possível somente por meio do proprietário atual do MDisk que está sendo usado como o disco quorum ativo.
Deve-se configurar um sistema estendido para atender aos seguintes requisitos:
  • Em conexões Fibre Channel, conecte cada nó diretamente a duas ou mais malhas SAN nos sites primário e secundário (2 a 8 malhas são suportadas). Em conexões iSCSI, conecte cada nó a duas ou mais malhas Ethernet nos sites primário e secundário. Os sites são definidos como domínios de falha independentes. Um domínio de falha é uma parte do sistema dentro de um limite, de modo que qualquer falha (como uma falha de energia, incêndio ou sobrecarga) dentro desse limite fique contida dentro do limite e a falha não se propague ou afete peças fora desse limite. Os domínios de falha podem estar na mesma sala ou entre as salas no datacenter, prédios no mesmo campus ou prédios em cidades diferentes. Tipos diferentes de domínios de falha protegem contra tipos diferentes de falhas.
  • Use um terceiro site para hospedar um disco quorum ou um aplicativo de quorum IP. Os discos quorum não podem estar localizados em sistemas de armazenamento conectados por iSCSI; portanto, não é possível configurar o armazenamento iSCSI em um terceiro site.
  • Se um sistema de armazenamento for usado no terceiro site, ele deverá suportar discos quorum estendidos. Mais informações estão disponíveis nas matrizes de interoperabilidade disponíveis no seguinte website:
    www.ibm.com/support
  • Coloque os sistemas de armazenamento independentes nos sites primário e secundário e use o espelhamento de volume para espelhar os dados do host entre os sistemas de armazenamento nos dois sites. Quando possível, configure o nó preferencial de cada volume para o nó no mesmo site do host para o qual o volume é mapeado.
  • As conexões podem variar com base no tipo de fibra e no Transceptor small form-factor pluggable (SFP) (onda longa e onda curta).
  • Os nós que estão no mesmo grupo de E/S e separados por mais de 100 metros (109 jardas) devem usar conexões Fibre Channel ou iSCSI de onda longa. Um Transceptor small form-factor pluggable (SFP) de onda longa pode ser comprado como um componente opcional e deve ser um dos Transceptores SFP de onda longa listados no website a seguir:
    www.ibm.com/support
  • Evite o uso de Inter-Switch Links (ISLs) nos caminhos entre os nós e os sistemas de armazenamento externo. Se for inevitável, não subscreva ISLs em excesso por causa do substancial tráfego de Fibre Channel nos ISLs. O entroncamento é necessário na maioria das configurações. Como os problemas de ISL são difíceis de diagnosticar, as estatísticas de erro de porta do comutador devem ser coletadas e regularmente monitoradas para detectar falhar.
  • O uso de um único comutador no terceiro site pode provocar a criação de uma única malha em vez de duas malhas independentes e redundantes. Uma malha única é uma configuração não suportada.
  • A porta Ethernet 1 em cada nó deve estar conectada à mesma sub-rede ou sub-redes. A porta Ethernet 2 (se usada) de cada nó deve estar conectada à mesma sub-rede (que poderá ser uma sub-rede diferente da porta 1). O mesmo princípio aplica-se a outras portas Ethernet.
  • Algumas ações de serviço requerem acesso físico a todos os nós em um sistema. Se os nós em um sistema estendido estiverem separados por mais de 100 metros, as ações de serviço poderão requerer múltiplas equipes de serviço. Entre em contato com o representante de serviço para consultar sobre o suporte a múltiplos sites.

Um sistema estendido localiza o disco quorum ativo ou um aplicativo de quorum de IP em um terceiro site. Se a comunicação entre os locais primário e secundário for perdida, o local com acesso ao disco quorum ativo continua a processar transações. Se a comunicação com o disco quorum ativo for perdida, um disco quorum alternativo em outro local poderá se tornar o disco quorum ativo.

Embora um sistema de nós possa ser configurado para usar até três discos quorum, somente um disco quorum pode ser escolhido para resolver uma situação na qual o sistema é particionado em dois conjuntos de nós de tamanho igual. O propósito dos outros discos quorum é fornecer redundância se um disco quorum falhar antes do sistema ser particionado.

O Figura 1 ilustra uma configuração do sistema estendido de exemplo. Quando usada com o espelhamento de volume, esta configuração fornece uma solução de alta disponibilidade que é tolerante a uma falha em um único site. Se o site primário ou secundário falhar, os sites restantes podem continuar a fazer operações de E/S. Nessa configuração, as conexões entre os nós no sistema são maiores que 100 metros de distância e, portanto, devem ser conexões Fibre Channel de ondas longas.
Figura 1. Um sistema estendido com disco quorum em um terceiro site
Um sistema estendido com disco quorum em um terceiro site
No Figura 1, o sistema de armazenamento que hospeda o disco quorum do terceiro site é conectado diretamente a um comutador em ambos os sites primário e secundário usando conexões Fibre Channel de ondas longas. Se o site primário ou o site secundário falhar, você deve garantir que o site restante retenha acesso direto ao sistema de armazenamento que hospeda os discos quorum.
Restrição: Não conecte um sistema de armazenamento em um site diretamente a uma malha do comutador no outro site.

Uma configuração alternativa pode usar um comutador Fibre Channel adicional no terceiro site com conexões a partir desse comutador para o site primário e para o site secundário.

Uma configuração do sistema estendido é suportada apenas quando o sistema de armazenamento que hospeda os discos quorum suporta quorum estendido. Embora outros tipos de sistemas de armazenamento possam ser usados para fornecer discos quorum, o acesso a esses discos quorum é sempre por meio de um único caminho.

Para os requisitos de configuração de disco quorum, consulte a nota técnica Orientação para identificar e alterar discos gerenciados designados como candidatos de disco quorum.

Ao configurar volumes espelhados em uma configuração de sistema estendido, considere se deseja configurar a prioridade de gravação de espelho para redundância para manter a sincronização das cópias por meio de atrasos temporárias na conclusão das gravações. Para mais detalhes, consulte as informações sobre volumes espelhados.

Sistema estendido e Metro Mirror ou Global Mirror

Um sistema estendido é projetado para continuar a operação após a perda de um domínio de falha.

O sistema estendido não pode garantir que ele possa operar após a falha de dois domínios de falha. Se a função sistema estendido aprimorado for configurada, você pode ativar uma substituição manual para esta situação. Também é possível usar o Metro Mirror ou o Global Mirror em um segundo sistema para uma recuperação de desastres estendida com um sistema estendido aprimorado ou um sistema estendido convencional. Você configura e gerencia parcerias de Metro Mirror ou Global Mirror que incluem um sistema estendido da mesma forma que outros relacionamentos de cópia remota. O sistema suporta a tecnologia de roteamento SAN, que inclui links FCIP, para conexões entre sistemas que usam o Metro Mirror ou o Global Mirror.

Os dois sistemas parceiros não podem estar no mesmo site de produção. Entretanto, eles podem ser colocados com o sistema de armazenamento que fornece o disco quorum ativo para o sistema estendido.

Etapas de Configuração

Estas etapas de configuração adicionais podem ser executadas usando a interface da linha de comandos (CLI) ou o GUI de gerenciamento.
  • Each nós no sistema devem ser designados a um site. Use o comando da CLI chnode. Se os nós adicionais forem cabeados para o sistema, será possível especificar esses nós como nós hot spare. Os nós hot-spare poderão assumir o controle das operações de E/S do host sem interrupção se algum nó no site se tornar indisponível. Para obter mais informações, consulte o tópico sobre incluir nós hot spare.
  • Cada sistema de armazenamento de backend deve ser designado para um site. Use o comando da CLI chcontroller.
  • Cada host deve ser designado a um local. Use o comando da CLI chhost
  • Depois de todos os nós, hosts e sistemas de armazenamento serem designados a um local, o modo aprimorado deve ser ativado ao alterar a topologia do sistema para estendida.
  • Para obter melhores resultados, configure um sistema estendido aprimorado para incluir pelo menos dois grupos de E/S (quatro nós). Um sistema com apenas um grupo de E/S não pode garantir a manutenção do espelhamento de dados ou de acesso ininterrupto ao host na presença de falhas do nó ou atualizações do sistema.

The sistema estendido não pode garantir que possa operar após a falha de dois domínios de falha. Você pode ativar uma substituição manual para esta situação se a função estiver configurada do sistema estendido aprimorado. Você também pode utilizar Metro Mirror ou Global Mirror com um sistema estendido aprimorado ou um sistema estendido convencional em um segundo sistema para recuperação de desastre estendido. Você configura e gerencia parcerias de Metro Mirror ou Global Mirror que incluem um sistema estendido da mesma forma que outros relacionamentos de cópia remota. O sistema suporta a tecnologia de roteamento SAN (incluindo links de FCIP) para conexões intersistema que usam o Metro Mirror ou Global Mirror.