Procedimento do Sistema de Recuperação
O procedimento do sistema de recuperação recupera todo o sistema se o estado do sistema for perdido. O procedimento recria o sistema de armazenamento usando dados de configuração salvos e também é conhecido como recuperação de Camada 3 (T3). Os dados de configuração salvos estão no disco quorum ativo e no arquivo de backup de configuração XML mais recente. A recuperação pode não ser capaz de restaurar todos os dados de volume.
- Nenhum nó está ativo
Não tente iniciar um resgate do nó (que o usuário pode iniciar usando a GUI do assistente de serviço ou o comando da CLI de serviço satask rescuenode). PARE e entre em contato com o Suporte técnico remoto IBM®®. Iniciar esse procedimento de recuperação do sistema T3 enquanto estiver nesse estado específico poderá resultar na perda dos arquivos de backup de configuração XML.
- Execute as ações de serviço somente quando orientado pelos procedimentos de correção. Se usadas inadequadamente, as ações de serviço poderão causar perda de acesso aos dados ou até mesmo perda de dados. Leia e entenda todas as instruções antes de concluir qualquer ação.
- O procedimento de recuperação poderá levar algumas horas, se o sistema usar dispositivos de grande capacidade como dispositivos de quorum.
- Se houver matrizes off-line após a execução do procedimento de recuperação, entre em contato com o Suporte IBM..
Não tente o procedimento de recuperação do sistema a menos que as condições a seguir sejam atendidas:
- Todas as condições são atendidas no Quando Executar o Procedimento de Recuperação do Sistema.
- Todos os erros de hardware foram corrigidos. Consulte o Corrigir Erros de Hardware
- Todos os nós possuem o status de candidato. Caso contrário, veja a etapa 1.
- Todos os nós devem estar no mesmo nível de código que o sistema tinha antes da falha. Se algum nó tiver sido modificado ou substituído, use o assistente de serviço para verificar os níveis de código e, quando necessário, reinstalar o nível de código para que ele corresponda ao nível que está em execução nos outros nós no sistema. Para obter informações adicionais, consulte Removendo as informações do sistema para nós com o código de erro 550 ou o código de erro 578 usando o assistente de serviço.
- Se o sistema estava usando o quorum de IP para metadados T3, verifique se todos os aplicativos de quorum de IP estão em execução.
- Preparação para recuperação do sistema:
- Revise as informações sobre quando executar o procedimento de recuperação do sistema.
- Corrija os erros de hardware e certifique-se de que todos os nós no sistema sejam mostrados no assistente de serviço ou na saída de sainfo lsservicenodes.
- Remova as informações do sistema para nós com código de erro 550 ou código de erro 578 usando o assistente de serviço, mas somente se a resposta do usuário recomendada para esses erros do nó for seguida.
- Para Volumes Virtuais (VVols), encerre os serviços para qualquer instância do Spectrum Control Base que esteja se conectando ao sistema. Use o comando service ibm_spectrum_control stop do Spectrum Control Base.
- Remova os nós hot spare do sistema e configure-os no modo candidato antes de iniciar o processo de recuperação. Execute o seguinte comando da CLI para remover o nó do sistema.
Assim que o nó for retornado no modo de serviço, execute o seguinte comando da CLI para configurá-lo no modo candidato.satask leavecluster -force spare-node-panel-namesatask stopservice spare-node-panel-name
- Executar a recuperação do sistema. Após preparar o sistema para
recuperação e atender a todas as condições prévias, execute a recuperação do sistema.Nota: Execute o procedimento em um sistema em uma malha por vez. Não execute o procedimento em diferentes nós no mesmo sistema. Essa restrição também se aplica a sistemas remotos.
- Concluir as ações para tornar o ambiente operacional.
- Recuperar os volumes offline usando a CLI.
- Verificação do sistema, por exemplo, para assegurar que todos os volumes mapeados possam acessar o host.
- Quando Executar o Procedimento de Recuperação do Sistema
Tente um procedimento de recuperação somente depois de uma investigação completa e meticulosa da causa da falha do sistema. Tente resolver esses problemas utilizando outros procedimentos de serviço. - Corrigir Erros de Hardware
Antes de executar um procedimento de recuperação do sistema, é importante identificar e corrigir a causa raiz dos problemas de hardware. - Removendo as informações do sistema para nós com o código de erro 550 ou o código de erro 578 usando o assistente de serviço
O procedimento de recuperação do sistema funciona somente quando todos os nós no sistema de nós a serem recuperados estão no status candidato. Se houver algum nó que exiba o código de erro 550 ou 578, remova os dados do sistema. - Executando a recuperação do sistema usando o assistente de serviço
É possível usar o assistente de serviço para iniciar a recuperação quando todos os nós que eram membros do sistema estiverem on-line e no status candidato. Se algum nó exibir o código de erro 550 ou 578, remova as informações do sistema para colocá-lo no status de candidato. Não execute o procedimento de recuperação em nós diferentes no mesmo sistema; esta restrição inclui sistemas remotos. - recuperação de volumes off-line usando a CLI
Se um procedimento de recuperação de Camada 3 for concluído com volumes off-line, é provável que os dados que estiverem no cache de gravação das caixas do nó tenham sido perdidos durante a falha que fez com que todas as caixas do nó perdessem o estado do cluster do sistema de armazenamento de blocos. É possível usar a interface da linha de comandos (CLI) para reconhecer que houve perda de dados do cache de gravação e para colocar o volume on-line novamente para tentar lidar com a perda de dados. - O Que Verificar Após a Execução da Recuperação do Sistema
Diversas tarefas podem ser concluídas antes do sistema ser usado.