Substituição manual de quorum em um sistema estendido ou HyperSwap

Uma substituição de quorum manual é necessária quando você enfrenta um desastre gradativo. Em raras situações, o sistema está sujeito ao que é referido como um desastre gradativo. Um desastre circulante ocorre quando um incidente possui escopo de largura e os seus efeitos são sentidos em várias etapas durante um período de tempo estendido. O cenário de exemplo a seguir descreve um desastre gradativo e mostra como se recuperar dele.

Um exemplo de um desastre circulante ocorre quando a seguinte situação é verdadeira:
  1. O link entre os dois sites falha, e, nesse ponto, o site usa o recurso de quorum automático para continuar a operação.
  2. O site do sistema que tem o controle do dispositivo de quorum falha (devido à uma indisponibilidade de energia, por exemplo).

Esse exemplo deixa o segundo site como o único site potencialmente capaz de continuar a E/S dos dados. Entretanto, ele não consegue fazer isso até ganhar o controle do dispositivo de quorum. Os MDisks na segunda parada do site. Os nós no site exibem o erro do nó 551, indicando que um número insuficiente de nós está disponível para formar um quorum em uma configuração do sistema estendido ou HyperSwap.

Nesse cenário, é possível executar o comando quorum override para substituir a seleção automática de dispositivo de quorum e criar um novo sistema que contenha os nós no segundo site.
Nota:
  • Para garantir que o sistema esteja no estado correto antes de ser usado, o comando quorum override pode ser executado apenas com a assistência do suporte.
  • Se uma interrupção de malha ocorrer enquanto o comando quorum override estiver executando, será possível que um subconjunto dos nós atualize o ID do sistema deles. Os nós atualizados exibem o erro do nó 550. Os nós que não foram atualizados exibem 551 e os nós são designados a dois sistemas diferentes. Nessa situação, é possível executar o comando quorum override novamente em um dos nós que relataram o erro 551. Esse comando atualiza todos os nós nos dois sistemas com um novo ID do cluster (sistema). Você pode então recuperar dados.

Imposição de condições de quorum

Deve-se executar o comando chsystem -topology stretched ou chsystem -topology hyperswap como parte do processo de instalação para que o sistema possa tornar o comando quorum override disponível se ocorrer um desastre gradativo. O comando quorum override não está disponível nos sistemas que não têm a topologia configurada como estendida ou hyperswap. Antes de poder usar o comando, os pré-requisitos a seguir devem ser atendidos:

  • Todos os grupos de E/S com dois nós são designados com um nó no site 1 e o outro no site 2.
  • Todos os sistemas de armazenamento com os discos gerenciados devem ter seu site que foi definido.

Quando esses pré-requisitos são atendidos e a seleção automática de quorum é ativada, o sistema tenta designar um dispositivo de quorum dentro dos três sites. Se um site não tiver um MDisk adequado para ser um dispositivo de quorum, um dispositivo de quorum não será designado a ele.

Nota: Após o comando chsystem -topology stretched ou chsystem -topology hyperswap ser executado, não será possível alterar a designação do site de qualquer controlador, exceto onde esse controlador for um novo controlador que possui apenas MDisks não gerenciados.

Ele também não permite configurações do site para os nós. Esse cumprimento é necessário para assegurar que o sistema opere corretamente para permitir que o comando quorum override opere corretamente.

Ao executar o comando chsystem -topology standard, será novamente possível alterar as configurações do site para nós e controladores. No entanto, este comando desativa o recurso de substituição de quorum. Portanto, execute chsystem -topology stretched ou chsystem -topology hyperswap ao concluir suas mudanças para ativar novamente esse suporte.