É possível criar uma configuração do sistema estendido aprimorado em que cada nó no sistema está
fisicamente localizado em um site diferente. Quando usado com tecnologias de espelhamento, como espelhamento de volume ou Copy Services, essas configurações podem ser usadas para manter acesso aos dados no sistema, no caso de falhas de energia ou indisponibilidades em todo o local.
Nota: Se o objetivo de seu design de solução for a alta disponibilidade, será melhor usar uma topologia IBM®
HyperSwap em vez de uma configuração de sistema estendido aprimorada. No entanto, se os objetivos incluem tópicos como
recuperação de desastre, Serviços de Cópia complexos ou escalabilidade mais alta, considere as restrições da
versão atual do HyperSwap. Para obter mais informações, consulte
Planejando alta disponibilidade.
A
configuração do sistema estendido aprimorada com o atributo de
topologia do sistema configurado como estendido é detalhada aqui. Maneiras mais antigas de configurar um sistema estendido são descritas
em versões anteriores do IBM Knowledge Center ainda suportadas. É
possível trocar de forma não disruptiva para a configuração do
sistema estendido aprimorada atual seguindo as etapas finais de
configuração apresentadas aqui de modo a obter melhor disponibilidade
e recuperação de desastre. Também é possível
mover sem interrupção da configuração do sistema estendido para a
configuração do sistema do HyperSwap para obter
disponibilidade, desempenho e recuperação de desastre ainda
melhores. Entre em contato como o Centro de suporte técnico remoto IBM
para obter orientação sobre a mudança de topologia de um
sistema existente.
Em uma configuração de sistema estendido, cada site é definido como um domínio de falha
independente. Se um site tiver uma falha, o outro site pode continuar a operar sem interrupção. Você também deve configurar um terceiro local para hospedar um dispositivo de quorum que forneça um desempate automático no caso de uma potencial falha de ligação entre os dois locais restantes. O local principal pode estar no mesmo espaço ou em espaços diferentes no datacenter, em prédios no mesmo campus ou em prédios em cidades diferentes. Tipos diferentes de sites protegem contra tipos diferentes de falhas.
- Os locais estão em uma única localização
- Se cada site for uma fase de energia diferente dentro de um único local
ou datacenter, o sistema poderá sobreviver à falha de qualquer domínio de energia
único. Por exemplo, um nó pode ser colocado em uma instalação de rack e o outro nó pode estar em outro rack. Cada rack é considerado
um site separado com sua própria fase de energia. Neste caso, se a energia fosse
perdida para um dos racks, o nó do parceiro no outro rack poderia
ser configurado para processar solicitações e fornecer eficazmente disponibilidade
para os dados, mesmo quando o outro estiver offline devido a uma interrupção de energia.
- Cada local está em localizações separadas
- Se cada site for um local físico diferente, o sistema poderá
sobreviver à falha de qualquer local único. Esses sites podem abranger distâncias
mais curtas, por exemplo, dois sites na mesma cidade, ou podem estar
dispersos mais longe geograficamente, como dois sites em cidades separadas. Se um site sofrer um desastre que abrange todo o site, o site restante poderá
permanecer disponível para processar solicitações.
Se configurado adequadamente, o sistema
continuará operando após a perda de um site. O pré-requisito chave
é que cada site contenha somente um nó de cada par de nós. Simplesmente colocar um par de nós do mesmo sistema em sites diferentes
para uma configuração de sistema estendido não fornece alta disponibilidade. Deve-se também configurar a
tecnologia de espelhamento apropriada e assegurar que todos os requisitos de configuração para essas
tecnologias sejam definidos adequadamente.
Observações: - Sistemas
estendidos podem ser utilizados com Virtualização de ID da Porta N
(NPIV). Em uma perda de site, as portas de failover de Fibre Channel
nos nós do site remoto se abrem e apresentam para a malha os nomes da
porta universal (WWPNs) das portas do host Fibre Channel dos nós
locais. A NPIV permite que os hosts efetuem login novamente com essas
portas sem precisar rotear novamente a partir do driver de caminhos
múltiplos. Nesse caso, mais latência pode ser introduzida pelo tempo
de trânsito de dados de roundtrip com as portas que estão fisicamente
no site remoto.
- As configurações Fibre Channel de sistema estendido
com controladores ativos/passivos, como sistemas
IBM DS5000,
IBM DS4000
e
IBM DS3000,
devem ser definidas com conexões suficientes para que todos os sites
tenham acesso direto aos dois sistemas de armazenamento externo.
Para configurações iSCSI com dois ou mais controladores ativo/passivo, tais como sistemas Família Storwize, os sistemas deverão ser
configurados com conexões suficientes, de modo que todos os sites tenham acesso direto a ambos os
sistemas de armazenamento externo. O acesso ao quorum
para o sistema estendido é possível somente por meio do proprietário atual
do MDisk que está sendo usado como o disco quorum ativo.
Deve-se configurar um sistema estendido para atender aos seguintes requisitos:
- Em conexões Fibre Channel, conecte cada nó diretamente a duas ou mais malhas SAN nos
sites primário e secundário (2 a 8 malhas são suportadas). Em conexões iSCSI, conecte cada nó a
duas ou mais malhas Ethernet nos sites primário e secundário. Os sites são definidos
como domínios de falha independentes. Um domínio de falha é uma parte do
sistema dentro de um limite, de modo que qualquer falha (como uma falha de energia,
incêndio ou sobrecarga) dentro desse limite fique contida dentro do limite
e a falha não se propague ou afete peças fora desse
limite. Os domínios de falha podem estar na mesma sala ou entre as salas
no datacenter, prédios no mesmo campus ou prédios em
cidades diferentes. Tipos diferentes de domínios de falha protegem contra
tipos diferentes de falhas.
- Use um terceiro site para hospedar um disco quorum ou um aplicativo de quorum IP.
Os
discos quorum não podem estar localizados em sistemas de
armazenamento conectados por iSCSI; portanto, não é possível
configurar o armazenamento iSCSI em um terceiro site.
- Se um sistema de
armazenamento for usado no terceiro site, ele deverá suportar discos quorum estendidos. Mais informações estão disponíveis nas matrizes de interoperabilidade disponíveis no seguinte website:
www.ibm.com/support
- Coloque os sistemas de armazenamento independentes nos sites primário e secundário e use o espelhamento de
volume para espelhar os dados do host entre os sistemas de armazenamento nos dois sites. Quando possível,
configure o nó preferencial de cada volume para o nó no mesmo site do host para o qual o volume é mapeado.
- As conexões podem variar com base no tipo de fibra e no Transceptor small form-factor pluggable (SFP) (onda longa
e onda curta).
- Os nós que estão no mesmo grupo de E/S e separados por mais de 100
metros (109 jardas) devem usar conexões Fibre Channel ou iSCSI de onda longa. Um Transceptor small form-factor pluggable (SFP) de onda longa pode
ser comprado como um componente opcional e deve ser um dos Transceptores SFP de onda longa listados
no website a seguir:
www.ibm.com/support
- Evite o uso de Inter-Switch Links (ISLs) nos caminhos entre os nós e os sistemas de armazenamento externo. Se for inevitável, não subscreva ISLs em
excesso por causa do substancial tráfego de Fibre Channel nos ISLs. O entroncamento é necessário na maioria das configurações. Como
os problemas de ISL são difíceis de diagnosticar, as estatísticas de erro
de porta do comutador devem ser coletadas e regularmente monitoradas para detectar falhar.
- O uso de um único comutador no terceiro site pode provocar a criação de
uma única malha em vez de duas malhas independentes e redundantes. Uma malha única é uma configuração não suportada.
- A porta Ethernet 1 em cada nó deve estar conectada à mesma sub-rede ou sub-redes. A porta Ethernet 2 (se
usada) de cada nó deve estar conectada à mesma sub-rede (que poderá ser uma sub-rede diferente da porta 1). O mesmo princípio aplica-se a outras portas Ethernet.
- Algumas ações de serviço requerem acesso físico a todos os nós em um
sistema. Se os nós em um sistema estendido estiverem separados por mais de 100 metros, as ações de serviço
poderão requerer múltiplas equipes de serviço. Entre em contato com o representante de serviço para consultar sobre o suporte a múltiplos
sites.
Um sistema estendido localiza o disco quorum ativo ou um
aplicativo de quorum de IP em um terceiro site. Se a comunicação entre os locais primário e secundário for perdida, o local com acesso ao disco quorum ativo continua a processar transações. Se a comunicação com o disco quorum ativo for perdida, um disco quorum alternativo em outro local poderá se tornar o disco quorum ativo.
Embora
um sistema de nós possa ser configurado para usar até três discos quorum,
somente um disco quorum pode ser escolhido para resolver uma situação na qual o
sistema é particionado em dois conjuntos de nós de tamanho igual. O propósito
dos outros discos quorum é fornecer redundância se um disco quorum falhar
antes do sistema ser particionado.
O
Figura 1 ilustra uma configuração do sistema
estendido de exemplo. Quando usada com o espelhamento de
volume, esta configuração fornece
uma solução de alta disponibilidade que é tolerante a uma falha em um único
site. Se o site primário ou secundário falhar, os sites
restantes podem continuar a fazer operações de E/S. Nessa configuração, as conexões entre
os nós no sistema são maiores que 100 metros de distância e, portanto, devem ser conexões
Fibre Channel de ondas longas.
Figura 1. Um sistema estendido com disco quorum em um terceiro site
No
Figura 1, o sistema de armazenamento que hospeda o disco quorum do terceiro site é conectado diretamente a um comutador em ambos os sites primário e secundário usando conexões
Fibre Channel de ondas longas. Se o site primário ou o
site secundário falhar, você deve garantir que o site
restante retenha acesso direto ao sistema de armazenamento que hospeda os discos
quorum.
Restrição: Não conecte
um sistema de armazenamento
em um site diretamente a uma malha do comutador no outro site.
Uma
configuração alternativa pode usar um comutador Fibre
Channel adicional no terceiro site com conexões a partir desse
comutador para o site primário e para o site secundário.
Uma configuração do sistema estendido é suportada apenas quando o sistema de armazenamento que hospeda os discos quorum suporta quorum estendido. Embora
outros tipos de sistemas de armazenamento possam ser usados para fornecer discos quorum, o acesso a esses discos quorum é sempre por meio de um único caminho.
Para os requisitos de configuração de disco quorum, consulte a nota técnica Orientação para identificar e alterar discos gerenciados designados como candidatos de disco quorum.
Ao configurar volumes espelhados em uma configuração de sistema estendido, considere se deseja configurar a prioridade de gravação de espelho para redundância para manter a sincronização das cópias por meio de atrasos temporárias na conclusão das gravações. Para mais detalhes, consulte as informações sobre
volumes espelhados.
Sistema estendido e Metro Mirror ou Global Mirror
Um sistema estendido é projetado para continuar a operação após a perda de um domínio de falha.
O sistema estendido não pode garantir que ele possa operar após a falha de dois domínios de falha. Se a função sistema estendido aprimorado for configurada,
você pode ativar uma substituição manual para esta situação. Também é possível usar o Metro Mirror ou o Global Mirror em um segundo
sistema para uma recuperação de desastres estendida com um sistema estendido aprimorado ou um sistema estendido convencional. Você configura e gerencia parcerias de Metro Mirror ou Global Mirror que incluem um sistema estendido da mesma forma que outros relacionamentos de cópia remota.
O sistema suporta a tecnologia de roteamento SAN, que inclui links FCIP, para conexões entre sistemas que usam o Metro Mirror ou o
Global Mirror.
Os dois sistemas parceiros não podem estar no mesmo site de produção. Entretanto, eles podem ser colocados com o sistema de armazenamento que fornece o disco quorum ativo para o sistema estendido.
Etapas de Configuração
Estas etapas de configuração adicionais
podem ser executadas usando a interface da linha de comandos (CLI) ou o
GUI de gerenciamento.
- Each nós no sistema devem ser designados a um site. Use o comando da CLI chnode. Se os nós adicionais forem cabeados para o sistema, será possível especificar esses nós como nós hot spare. Os nós hot-spare poderão assumir o
controle das operações de E/S do host sem interrupção se algum nó no site se tornar indisponível. Para obter mais informações, consulte o tópico sobre incluir nós hot spare.
- Cada sistema de armazenamento de backend
deve ser designado para um site. Use o comando da CLI chcontroller.
- Cada host deve ser designado a um
local. Use o comando da CLI chhost
- Depois de todos os nós, hosts e sistemas de armazenamento
serem designados a um local, o modo aprimorado deve ser ativado ao alterar a
topologia do sistema para estendida.
- Para obter melhores resultados, configure um sistema estendido
aprimorado para incluir pelo menos dois grupos de E/S (quatro nós). Um sistema
com apenas um grupo de E/S não pode garantir a manutenção do espelhamento de
dados ou de acesso ininterrupto ao host na presença de falhas do nó
ou atualizações do sistema.
The sistema estendido não pode garantir que possa operar após a falha de dois domínios de falha. Você pode ativar uma substituição manual para esta situação
se a função estiver configurada do sistema estendido aprimorado. Você também pode
utilizar Metro Mirror ou Global Mirror com
um sistema estendido aprimorado ou um sistema estendido convencional
em um segundo sistema
para recuperação de desastre estendido. Você configura e gerencia parcerias de Metro Mirror ou Global Mirror que incluem um sistema estendido da mesma forma que outros relacionamentos de cópia remota.
O sistema suporta a tecnologia de roteamento SAN (incluindo
links de FCIP) para conexões intersistema que usam o Metro Mirror ou Global Mirror.