MAP 5350: Desligando um nó

MAP 5350: o desligamento de um nó ajuda a desligar um único nó para executar uma ação de serviço sem interromper acesso do host aos volumes.

Antes de Iniciar

Se a solução estiver configurada corretamente, o desligamento de um único nó não interrompe a operação normal de um sistema. Um sistema tem nós em pares chamados de grupos de E/S. Um grupo de E/S continua a manipular a E/S para os discos que ele gerencia tendo somente um único nó ligado. No entanto, o desempenho diminui e a resiliência para erro é reduzida.

Tenha cuidado quando desligar um nó do sistema para não afetar o sistema além do necessário.
Nota: Se os procedimentos descritos aqui não forem seguidos, seus hosts de aplicativos poderão perder acesso aos seus dados ou eles poderão, no pior caso, perder dados.
É possível usar os seguintes métodos preferenciais para desligar um nó que seja um membro de um sistema e não offline:
  1. Use a opção Desligar no GUI de gerenciamento ou na interface do assistente de serviço.
  2. Use o comando da CLI stopsystem –nodename.

É preferível usar o GUI de gerenciamento ou a interface da linha de comandos (CLI) para desligar um nó. Estes métodos fornecem uma transferência controlada para o nó do parceiro e fornecem melhor resiliência para outras falhas no sistema.

Somente se um nó estiver off-line ou não for um membro de um sistema é que deverá ser desligado usando o botão de comando de energia.

Sobre Esta Tarefa

Para fornecer o mínimo de interrupção ao desligar um nó, todas as condições a seguir devem aplicar-se.
  • O outro nó no grupo do E/S está ligado e ativo no sistema.
  • O outro nó no grupo de E/S possui conexões SAN Fibre Channel para todos os hosts e controladores de disco que são gerenciados pelo grupo de E/S.
  • Todos os volumes que forem manipulados por este grupo de E/S estão on-line.
  • Os caminhos múltiplos do host estão online para o outro nó no grupo de E/S.

Em algumas circunstâncias, o motivo do desligamento do nó pode tornar essas condições impossíveis. Por exemplo, se um adaptador Fibre Channel com falha for substituído, os volumes não mostrarão um status online. Use seu julgamento para decidir se é seguro continuar quando uma condição não é atendida. Sempre verifique com o administrador do sistema antes de continuar com o desligamento, pois isso pode afetar o acesso de E/S. O administrador do sistema poderá preferir esperar por um momento mais adequado ou suspender os aplicativos de host.

Para assegurar uma reinicialização suave, um nó deverá salvar estruturas de dados que ele não pode recriar em sua unidade de disco interna local. A quantia de dados que o nó salva no disco local pode ser alta, portanto, essa operação pode levar vários minutos. Não tente interromper o desligamento controlado.

Atenção: As seguintes ações não permitem que o nó salve dados em seu disco local. Portanto, não desligue um nó usando os seguintes métodos:
  • Mantendo o botão de comando de energia pressionado no nó (a menos que ele seja um SAN Volume Controller 2145-SV1 ).

    Ao pressionar e soltar o botão de comando de energia, o nó indica essa ação para o software, de modo que o nó possa gravar seus dados no disco local antes que o nó desligue.

    Ao manter o botão de comando de energia pressionado, o hardware interpreta esta ação como uma indicação de desligamento de emergência e encerra imediatamente. O hardware não salva os dados em um disco local antes de desligar. A energia de emergência ocorre aproximadamente 4 segundos depois que você pressiona e mantém pressionado o botão de comando de energia.

  • Pressionando o botão de comando de reconfiguração no painel do sistema de diagnósticos por indicadores luminosos.
Importante: Desligando um nó do SAN Volume Controller 2145-DH8 até que seja possível drenar as baterias no dia seguinte. Siga estas etapas para evitar que as baterias sejam muito descarregadas enquanto o nó estiver conectado à energia, mas não estiver ligado.
  1. Puxe ambas as baterias para fora do nó. Mantenha-as fora até que esteja pronto para ligar o nó.
  2. Empurre as baterias para dentro antes de pressionar o botão de comando de energia para ligar o nó.
Se você desconectar a energia de um nó do SAN Volume Controller 2145-DH8 e não puder reconectar a energia para ele novamente nas próximas 24 horas, siga estas etapas para evitar que as baterias sejam muito descarregadas enquanto o nó não está conectado à energia:
  1. Depois que os dois cabos de energia forem desconectados do nó, puxe ambas as baterias para fora do nó. Esta etapa desliga completamente o painel traseiro da bateria.
  2. Empurre as baterias para trás novamente.

Usando o GUI de gerenciamento para desligar um sistema

Use o GUI de gerenciamento para desligar um sistema.

Procedimento

Para usar o GUI de gerenciamento para desligar um sistema, conclua as etapas a seguir:

  1. Inicie o GUI de gerenciamento para o sistema em que estiver sendo feita manutenção.
  2. Selecione Monitoramento > Sistema.

    Se os nós para desligar são mostrados como Offline, os nós não estão participando no sistema. Em tais circunstâncias, use o botão de comando de energia nos nós off-line para desligar os nós.

    Se os nós para desligar são mostrados como Online, desligar os nós pode resultar em seus volumes dependentes também ficarem offline:

    1. Selecione o nó e clique em Mostrar volumes dependentes.
    2. Confirme se o status de cada volume no grupo de E/S está Online. Pode ser necessário para visualizar mais de uma página.
      Pode ser necessário para visualizar mais de uma página.

      Se quaisquer volumes forem Comprometidos, somente um nó na E/S está processando solicitações de E/S para esse volume. Se esse nó está desligado, ele causa impacto em todos os hosts que estão enviando solicitações de E/S para o volume comprometido.

      Se algum volume for comprometido e você acredita que isso pode ser, porque o nó do parceiro no grupo de E/S foi desligado recentemente, aguarde até que a atualização da tela mostra todos os volumes online. Todos os volumes devem estar on-line dentro de 30 minutos do nó do parceiro que estiver sendo desligado.

      Nota: Após aguardar 30 minutos, se tiver um volume comprometido e todos os nós e MDisks associados estiverem on-line, entre em contato com o suporte para obter assistência.

      Assegure-se de que todos os volumes que são usados pelos hosts estejam on-line antes de continuar.

    3. Se possível, verifique se todos os hosts que acessam volumes que são gerenciados por esse grupo de E/S estão aptos a efetuar failover para usar caminhos que são fornecidos pelo outro nó no grupo.

      Conclua esta verificação usando o software do driver de dispositivo de caminhos múltiplos do sistema host. Os comandos para usar diferem, dependendo do driver de dispositivo de caminhos múltiplos que estiver sendo usado.

      Se for usado o Driver de Dispositivo do Subsistema de Caminhos Múltiplos (SDD) do Sistema de Armazenamento, o comando para caminhos de consulta é datapath query device.

      Pode demorar algum tempo para os drivers de dispositivo de caminhos múltiplos redescobrir caminhos após um nó ser ligado. Se não for possível verificar no host que todos os caminhos para ambos os nós no grupo de E/S estão disponíveis, não desligue um nó durante 30 minutos após o nó do parceiro ter sido ligado ou o acesso ao volume poderá ser perdido.

    4. Se decidir que ele está bom, continue o desligamento do nó, selecione o nó a ser desligado e clique em Desligar Sistema.
    5. Clique em OK. Se o nó selecionado for o último nó restante que fornece acesso a um volume, por exemplo, um nó que contém unidades flash com volumes não espelhados, o painel Encerrando um nó forçado é exibido com uma lista de volumes que ficarão off-line se o nó for encerrado.
    6. Verifique se nenhum aplicativo do host acessa os volumes que ficarão offline. Continue com o encerramento somente se a perda de acesso a esses volumes for aceitável. Para continuar com o encerramento do nó, clique em Forçar Encerramento.

O que Fazer Depois

Durante o procedimento de encerramento, o nó salva suas estruturas de dados em seu disco local e move todos os dados de gravação que estiverem mantidos em cache para os discos de SAN. Este processamento pode levar vários minutos.

No final desse processamento, o sistema é desligado.

Utilizando a CLI do sistema para desligar um nó

Use a interface da linha de comandos (CLI) para desligar um nó.

Procedimento

  1. Emita o comando lsnode da CLI para exibir uma lista de nós no sistema e suas propriedades. Localize o nó para encerrar e anote o nome de seu grupo de E/S. Confirme se o outro nó no grupo de E/S está online.
    -delim lsnode: 
    
    id:name :UPS_serial_number :WWNN: status :IO_group_id: IO_group_name:config_node:
    UPS_unique_id 
    1 :group1node1 :10L3ASH: 500507680100002C :online: 0 :io_grp0 :yes: 202381001C0D18D8 
    2 :group1node2 :10L3ANF: 5005076801000009 :online: 0 :io_grp0 :no: 202381001C0D1796 
    3 :group2node1 :10L3ASH: 5005076801000001 :online: 1 :io_grp1 :no: 202381001C0D18D8 
    4 :group2node2 :10L3ANF: 50050768010000F4 :online: 1 :io_grp1 :no: 202381001C0D1796
    

    Se o nó para desligar é mostrado como Offline, o nó não está participando no sistema e não está processando solicitações de E/S. Em tais circunstâncias, use o botão de comando de energia do nó para desligar o nó.

    Desligar um nó que esteja On-line enquanto seu nó do parceiro não está on-line impacta todos os hosts com solicitações de E/S para volumes que são gerenciados pelo grupo de E/S. Assegure-se que outro nó no grupo de E/S esteja online antes de continuar.

  2. Emita o comando da CLI lsdependentvdisks -node <name> para listar os volumes que dependem do status de um nó especificado.
    lsdependentvdisks -node group1node1 
    
    vdisk_id       vdisk_name
    0 vdisk0
    1 vdisk1

    Se o nó ficar offline ou for removido do sistema, os volumes dependentes também ficarão offline. Antes de colocar um nó off-line ou removê-lo do sistema, é possível usar o comando para assegurar-se de que nenhum acesso a quaisquer volumes seja perdido.

  3. Se decidir que é aceitável continuar a desligar o nó, insira o comando da CLI stopsystem –node <name> para desligar o nó. Use o parâmetro –node para evitar desligar o sistema inteiro:
    stopsystem – node group1node1
    Tem certeza de que deseja continuar com o encerramento? sim
    
    Nota: Para encerrar um nó com volumes dependentes, inclua o parâmetro -force no comando stopsystem. O parâmetro force força a continuação do comando, embora os volumes dependentes do nó fiquem offline. Use o parâmetro force com cuidado. O acesso aos dados nos volumes dependentes do nó será perdido.

    O nó salva suas estruturas de dados em seu disco local, já que ele encerra e move todos os dados de gravação no cache para os discos de SAN. O encerramento pode levar vários minutos.

    No fim deste processo, o nó é desligado.

Encerrando usando o botão de controle de energia do sistema

Não use o botão de controle de energia para desligar um nó, a menos que haja uma emergência ou outro procedimento que o leve a fazer isso.

Antes de Iniciar

Com esse método, não é possível verificar o status do sistema no painel frontal, portanto, não é possível informar se o desligamento é responsável por causar interrupção excessiva no sistema. Em vez disso, use o GUI de gerenciamento ou os comandos da CLI, descritos nos tópicos anteriores para desligar um nó ativo.

Sobre Esta Tarefa

Se precisar usar este método, observe no Figura 1 e no Figura 2 que cada tipo de modelo possui um botão de controle de energia  1  na frente.

Figura 1. Botão de controle de energia nos modelos SAN Volume Controller 2145-CF8, 2145-CG8 e 2145-DH8. Botão de controle de energia no modelo SAN Volume Controller 2145-DH8
Botão de controle de energia do modelo 2145-DH8
Figura 2. Botão de controle de energia e luzes de LED no modelo SAN Volume Controller 2145-SV1
Botão de controle de energia do modelo SAN Volume Controller 2145-SV1
  •  1  Botão de controle de energia e LED ligado
  •   2   LED de Identificação
  •   3   LED de status do nó
  •   4   LED de falha do nó
  •   5   LED de status da bateria

Ao determinar que é seguro fazer isso, pressione e solte imediatamente o botão de energia. Nos modelos diferentes de 2145-DH8 e 2145-SV1 , o monitor do painel frontal foi alterado para exibir Desligando e exibe uma barra de progresso.

Nota: O 2145-DH8 e o 2145-SV1 não têm uma exibição do painel frontal, mas os LEDs de status  2 ,  3 ,  4  e  5  em Figura 2 são todos desligados e o LED de ativação  1  muda de ligado para piscando.

Resultados

O nó salva suas estruturas de dados em disco enquanto está desligando. O processo de desligamento pode demorar até 5 minutos.

Quando um nó é desligado usando o botão power (ou devido a uma falha de energia), o nó do parceiro em seu grupo de E/S para imediatamente usando seu cache para novos dados de gravação e remove o estágio de qualquer dado de gravação já em seu cache para os discos conectados por SAN.

A duração da movimentação de dados do cache depende da velocidade e da utilização dos controladores de disco. O tempo para conclusão é menor do que 15 minutos, mas pode ser mais longo. Se os dados estiverem esperando para serem gravados em um disco que esteja off-line, a remoção do estágio não poderá ser concluída.

Um nó que desliga e reinicia enquanto seu nó do parceiro continua a processar E/S pode não ser capaz de se tornar um membro ativo do grupo de E/S imediatamente. O nó deve aguardar até que o nó do parceiro conclua a movimentação de dados do cache.

Se o nó do parceiro é desligado durante este período, o acesso ao armazenamento SAN que é gerenciado por este grupo de E/S é perdido. Se um dos nós no grupo de E/S for incapaz de servir quaisquer volumes de E/S, os volumes que são gerenciados por esse grupo de E/S terão um status de Degraded. Por exemplo, se o nó do parceiro no grupo de E/S ainda estiver limpando seu cache de gravação, ele terá um status de Degraded.