Reincluindo um nó reparado em um sistema em cluster usando a CLI

É possível usar a interface da linha de comandos (CLI) para reincluir um nó com falha de volta em um sistema em cluster após ele ter sido reparado.

Antes de Iniciar

Antes de incluir um nó em um sistema em cluster, você deve certificar-se de que o zoneamento switchd\ esteja configurado para que o nó que está sendo incluído esteja na mesma zona que todos os outros nós no sistema em cluster. Se você estiver substituindo um nó e o comutador for zoneado pelo nome da porta universal (WWPN) em vez de pela porta do comutador, certifique-se de que o comutador esteja configurado de forma que o nó que está sendo incluído esteja na mesma VSAN/zona.

Atenção:
  1. Se estiver incluindo novamente um nó na SAN, certifique-se de incluir o nó no mesmo grupo de E/S do qual ele foi removido. A falha ao selecionar o grupo de E/S correto pode resultar na distorção de dados. Você deve usar as informações que foram registradas quando o nó foi originalmente incluído no sistema em cluster. Se você não tiver acesso a essas informações, entre em contato com o IBM® Support Center para incluir o nó de volta no sistema em cluster sem corromper os dados.
  2. Os LUNs que são apresentados às portas no novo nó devem ser iguais aos LUNs que são apresentados aos nós que existem atualmente no sistema em cluster. Você deve assegurar que os LUNs sejam os mesmos antes de incluir o novo nó no sistema em cluster.
  3. O mascaramento de LUN para cada LUN deve ser idêntico em todos os nós em um sistema em cluster. Você deve assegurar que o mascaramento de cada LUN seja idêntico antes de incluir o novo nó no sistema em cluster.
  4. Você deve assegurar que o tipo de modelo do novo nó seja suportado pelo nível de software do SAN Volume Controller que está instalado no sistema em cluster. Se o tipo de modelo não for suportado pelo nível de software do SAN Volume Controller , atualização o sistema em cluster para um nível de software que suporte o tipo de modelo do novo nó. Consulte o Web site a seguir para obter os mais recentes níveis de software suportados:

    www.ibm.com/support

Sobre Esta Tarefa

Procedimentos especiais ao incluir um nó em um sistema em cluster

Os aplicativos nos sistemas host direcionam as operações de E/S para sistemas de arquivos ou volumes lógicos que são mapeados pelo sistema operacional para caminhos virtuais (vpaths), que são pseudo-objetos de disco que são suportados pelo Subsystem Device Driver (SDD). O SDD mantém uma associação entre um vpath e um volume SAN Volume Controller . Essa associação usa um identificador (UID) único para o volume e nunca é reusado. O UID permite que o SDD associe vpaths diretamente a volumes.

O SDD opera em uma pilha de protocolo que contém unidades de disco e Fibre Channel, usadas para a comunicação com o SAN Volume Controller usando o protocolo SCSI sobre Fibre Channel conforme definido pelo padrão ANSI FCS. O esquema de endereçamento fornecido por esses drivers de dispositivo SCSI e Fibre Channel usa uma combinação de um número da unidade lógica (LUN) SCSI e o nome universal do nó (WWNN) para o nó e portas Fibre Channel.

Se ocorrer um erro, os procedimentos de recuperação de erro (ERPs) operam em várias camadas da pilha de protocolo. Alguns desses ERPs fazem com que a E/S seja reconduzida, usando os mesmos números de WWNN e LUN usados anteriormente.

O SDD não verifica a associação do volume ao vpath em cada operação de E/S que ele executa.

Antes de incluir um nó no sistema em cluster, você deve verificar se alguma das seguintes condições são verdadeiras:
  • O sistema em cluster possui mais de um grupo de E/S.
  • O nó que está sendo incluído no sistema em cluster usa um hardware de nó físico ou um slot que foi usado anteriormente para um nó no sistema em cluster.
  • O nó que está sendo incluído no sistema em cluster usa o hardware de nó físico ou um slot que foi usado anteriormente para um nó em outro sistema em cluster e ambos os sistemas em cluster têm visibilidade para os mesmos hosts e armazenamento de backend.
Se alguma das condições anteriores for verdadeira, os seguintes procedimentos especiais se aplicam:
  • O nó deve ser incluído no mesmo grupo de E/S em que estava anteriormente. É possível usar o comando lsnode da interface da linha de comandos (CLI) ou o GUI de gerenciamento para determinar o WWN dos nós do sistema em cluster.
  • Antes de incluir o nó de volta no sistema em cluster, você deve encerrar todos os hosts usando o sistema em cluster. O nó deve então ser incluído antes que os hosts sejam reinicializados. Se as informações do grupo de E/S estiverem indisponíveis ou se for inconveniente encerrar e reinicializar todos os hosts usando o sistema em cluster, faça o seguinte:
    • Em todos os hosts que estão conectados ao sistema em cluster, desconfigure o driver de dispositivo do adaptador Fibre Channel, o driver de dispositivo do disco e o driver de caminhos múltiplos antes de incluir o nó no sistema em cluster.
    • Inclua o nó no sistema em cluster e, em seguida, reconfigure o driver de dispositivo do adaptador Fibre Channel, o driver de dispositivo do disco e o driver de caminhos múltiplos.

Cenários nos quais os procedimentos especiais se aplicam

Os dois cenários a seguir descrevem situações nas quais os procedimentos especiais podem ser aplicados:
  • Quatro nós de um sistema em cluster de oito nós foram perdidos devido à falha de um par de 2145 UPS ou de quatro 2145 UPS-1U . Nesse caso, os quatro nós devem ser incluídos de volta no sistema em cluster usando o comando da CLI addnode ou o GUI de gerenciamento.
    Nota: Não é necessário executar o comando addnode em um nó cujo parceiro já está em um sistema em cluster; o sistema em cluster detecta automaticamente um candidato on-line.
  • Um usuário decide excluir quatro nós do sistema em cluster e incluí-los de volta no sistema em cluster usando o comando addnode da CLI ou o GUI de gerenciamento.

Para nós 5.1.0, o SAN Volume Controller reinclui automaticamente nós que falharam de volta no sistema em cluster. Se o sistema em cluster relatar um erro para um nó ausente (código de erro 1195) e que o nó foi reparado e reiniciado, o sistema em cluster reincluirá automaticamente o nó de volta no sistema em cluster. Esse processo pode levar até 20 minutos para ser concluído, portanto, é possível incluir o nó novamente, de forma manual, concluindo as seguintes etapas:

Procedimento

  1. Emita o comando lsnode da CLI para listar os nós que atualmente fazem parte do sistema em cluster e determinar o grupo de E/S ao qual incluir o nó.

    A seguir há um exemplo da saída exibida:

    lsnode -delim :
    
    id:name:UPS_serial_number:WWNN:status:IO_group_id:IO_group_name
    :config_node:UPS_unique_id:hardware:iscsi_name:iscsi_alias
    :panel_name:enclosure_id:canister_id:enclosure_serial_number
    1:node1::50050868010050B2:online:0:io_grp0:yes::100:iqn.1986-03.com.ibm
    :2145.cluster0.node1::02-1:2:1:123ABCG
    2:node2::50050869010050B2:online:0:io_grp0:no::100:iqn.1986-03.com.ibm
    :2145.cluster0.node2::02-2:2:2:123ABDG
    lsnode -delim :
    
    Id:name:UPS_serial_number:WWNN:status:IO_group_id:IO_group_name
    :config_node:UPS_unique_id:hardware:iscsi_name:iscsi_alias
    :panel_name:enclosure_id:canister_id:enclosure_serial_number
    1:node1:UPS_Fake_SN:50050768010050B1:online:0:io_grp0:yes
    :10000000000050B1:8G4:iqn.1986-03.com.ibm:2145.cluster0.node1:000368:::
  2. Emita o comando da CLI lsnodecandidate para listar nós que não estão designados a um sistema em cluster e para verificar se um segundo nó foi incluído em um grupo de E/S.

    A seguir há um exemplo da saída exibida:

    lsnodecandidate -delim :
    
    id:panel_name:UPS_serial_number:UPS_unique_id:hardware
    5005076801000001:000341:10L3ASH:202381001C0D18D8:8A4
    5005076801000009:000237:10L3ANF:202381001C0D1796:8A4
    50050768010000F4:001245:10L3ANF:202381001C0D1796:8A4
    ....
  3. Emita o comando da CLI addnode para incluir um nó no sistema em cluster.
    Importante: Cada nó de um grupo de E/S deve ser conectado a uma fonte de alimentação ininterrupta diferente.

    A seguir está um exemplo do comando da CLI que pode ser emitido para incluir um nó no sistema em cluster usando o parâmetro de nome do painel:

    addnode -panelname 000237
     -iogrp io_grp0 

    Em que 000237 é o nome do painel do nó, io_grp0 é o nome do grupo de E/S no qual você está incluindo o nó.

    A seguir está um exemplo do comando da CLI que pode ser emitido para incluir um nó no sistema em cluster usando o parâmetro do WWNN:

    addnode -wwnodename 5005076801000001
     -iogrp io_grp1 

    Em que 5005076801000001 é o WWNN do nó, io_grp1 é o nome do grupo de E/S no qual você está incluindo o nó.

  4. Emita o comando lsnode da CLI para verificar a configuração final.

    O exemplo a seguir mostra a saída exibida:

    lsnode -delim :
    
    id:name:UPS_serial_number:WWNN:status:IO_group_id:IO_group_name:config_node:UPS_unique_id:
    hardware:iscsi_name:iscsi_alias
    1:node1:10L3ASH:0000000000000000:offline:0:io_grp0:no:1000000000003206:
    8A4:iqn.1986-03.com.ibm:2145.ndihill.node1:
    Registre as seguintes informações do novo nó:
    • Nome do nó
    • Número de série do nó
    • WWNN
    • IQNs (se estiver usando hosts conectados usando conexões iSCSI)
    • Todos os WWPNs
    • O grupo de E/S que contém o nó
    Nota: Se esse comando for emitido rapidamente após a inclusão dos nós no sistema em cluster, o status dos nós poderá ser incluindo. O status será mostrado como incluindo, se o processo de inclusão dos nós no sistema em cluster ainda estiver em andamento. Não é necessário aguardar que o status de todos os nós seja on-line para continuar com o processo de configuração.

Resultados

Os nós são incluídos no sistema em cluster.