Corrigir Erros de Hardware
Antes de executar um procedimento de recuperação do sistema, é importante identificar e corrigir a causa raiz dos problemas de hardware.
Identificar e corrigir a causa raiz pode ajudar a recuperar um sistema, se essas forem
falhas que estão causando a falha do sistema. A seguir estão problemas comuns que podem ser facilmente
resolvidos:
- O nó está desligado ou os cabos de energia foram desconectados.
- Verifique o status de cada nó que é membro do sistema. Resolva todos os erros.
- Todos os nós devem relatar um erro de nó 578 ou nenhum nome de cluster será
mostrado na tela Cluster:. Esses códigos de erro indicam que o sistema perdeu
seus dados de configuração. Se quaisquer nós relatarem algo diferente desses códigos de erro, não execute uma recuperação. É possível encontrar situações onde nós que não são de configuração relatem erros de nó, como um erro de nó 550. O erro 550 também pode indicar que um nó não pode se unir a um sistema.Nota: Se algum dos botões no painel frontal for pressionado após esses dois códigos de erro serem relatados, o relatório para o nó retornará ao erro de nó 578. A alteração no relatório acontecer após aproximadamente 60 segundos. Além disso, se o nó tiver sido reinicializado ou se tiverem sido tomadas ações de serviço de hardware, talvez o nó não mostre nenhum nome de cluster na tela Cluster:.
- Se algum nó mostrar Erro de Nó: 550,
registre os dados a partir da segunda linha do visor. Se o último caractere na segunda linha do visor for >, utilize o botão para direita para rolar a tela para a direita.
- Além de Erro de nó: 550, a segunda linha do visor pode mostrar uma lista de IDs do painel frontal do nó (7 dígitos) que são separados por espaços. A lista também pode mostrar o ID de WWPN/LUN (16 dígitos hexadecimais seguidos por uma barra e um número decimal).
- Se os dados de erro contiverem algum ID do painel frontal, assegure que o nó referido pelo ID do painel frontal esteja mostrando Erro de Nó 578:. Se ele não estiver relatando o erro de nó 578, assegure que os dois nós possam se comunicar entre si. Verifique a conectividade da SAN e reinicie um dos dois nós pressionando o botão de energia do painel frontal duas vezes.
- Se os dados de erro contiverem um ID de WWPN/LUN, verifique a conectividade da SAN entre este nó e esse WWPN. Verifique o sistema de armazenamento para assegurar que a LUN referenciada esteja online. Após a verificação, reinicie o nó pressionando o botão de energia no painel frontal duas vezes.
Nota: Se (depois de resolver todos esses cenários) metade ou mais da metade dos nós estiverem relatando Erro de nó: 578, será adequado executar o procedimento de recuperação. - Para todos os nós que relatem um erro de nó 550, verifique se todo o hardware ausente que for identificado por esses erros estão alimentados e conectados sem falhas.
- Se não for possível reiniciar o sistema e se algum nó diferente do nó atual estiver relatando o erro de nó 550 ou 578, deve-se remover os dados do sistema desses nós. Essa ação reconhece a perda de dados e coloca os nós no estado candidato necessário.
- Todos os nós devem relatar um erro de nó 578 ou nenhum nome de cluster será
mostrado na tela Cluster:. Esses códigos de erro indicam que o sistema perdeu
seus dados de configuração. Se quaisquer nós relatarem algo diferente desses códigos de erro, não execute uma recuperação. É possível encontrar situações onde nós que não são de configuração relatem erros de nó, como um erro de nó 550. O erro 550 também pode indicar que um nó não pode se unir a um sistema.
Tópico pai: Procedimento do Sistema de Recuperação