Propriedades da matriz
Uma propriedade-chave de uma matriz não distribuída é que algumas unidades dentro da matriz são designadas como unidades sobressalentes. Em uma configuração de matriz não distribuída, as unidades sobressalentes são usadas somente quando outras unidades na matriz falham.
Uma matriz não distribuída pode conter de 2 a 16 unidades; várias matrizes criam a capacidade para um conjunto. Para que haja redundância, unidades hot spare são alocadas para assumir as operações de leitura ou gravação, caso alguma das outras unidades falhar. O resto do tempo, as unidades sobressalentes estão inativas e não processam solicitações para o sistema. Quando uma unidade do membro falha na matriz, os dados podem ser recuperados apenas para o sobressalente tão rápido quanto a unidade pode gravar os dados. Devido a esse gargalo, a reconstrução dos dados poderá levar muitas horas, pois o sistema tentará balancear o host e reconstruir a carga de trabalho. Como resultado, o carregamento no restante das unidades do membro pode aumentar significativamente. A latência de E/S na matriz de reconstrução é afetada durante todo esse tempo. Como os dados de volume são divididos nos MDisks, todos os volumes são afetados durante o tempo levado pra a reconstrução da unidade.
Exemplos de uma matriz


Níveis RAID suportados
O sistema suporta os níveis do RAID a seguir: RAID 0, RAID 1 , RAID 5, RAID 6 e RAID 10.
| Nível | Contagem de unidade (DC)1 | Capacidade de matriz aproximada | Redundância2 |
|---|---|---|---|
| RAID 0 | 1 - 8 | DC * DS3 | Nenhuma |
| RAID 1 | 2 | DS | 1 |
| RAID 5 | 3 - 16 | (DC - 1) * DS | 1 |
| RAID 6 | 5 – 16 | Menor que (DC – 2) * DS | 2 |
| RAID 10 | 2 – 16, uniforme | (DC/2) * DS | 14 |
|
|
|||
Inicialização da matriz
Quando uma matriz for criada, os membros da matriz serão sincronizados entre si por um processo de inicialização de segundo plano. A matriz está disponível para E/S durante esse processo. A inicialização não tem nenhum impacto sobre a disponibilidade, devido a falhas na unidade do membro.
Falhas de unidade e redundância
Se uma matriz tiver a redundância necessária, uma unidade será removida da matriz se ela falhar ou se seu acesso tiver sido perdido. Se uma unidade sobressalente adequada estiver disponível, ela será levada à matriz e a unidade, em seguida, iniciará a sincronização.
Cada matriz tem um conjunto de objetivos que descreve a localização e o desempenho preferencial de cada membro da matriz. Se você perder o acesso a um nó, você perderá o acesso a todas as unidades no nó. As unidades configuradas como membros da matriz não são removidas da matriz. Quando o nó está disponível, o sistema copia os dados que foram modificados enquanto o nó estava off-line da unidade boa até para a unidade desatualizada.
O rebalanceamento é atingido usando a troca simultânea que migra dados entre as unidades sem afetar a redundância.
É possível iniciar uma troca e os objetivos da matriz também podem ser atualizados para facilitar as mudanças na configuração.
unidade de proteção e objetivos
Comandos na Matriz possuem um atributo que é chamado spare_protection, que pode ser usado para especificar o número de sobressalentes válidos para um membro da matriz. O atributo da matriz spare_protection_min é o mínimo de proteção sobressalente dos membros da matriz.
O atributo de matriz spare_goal é o número de boas unidades sobressalentes que são necessárias para proteger cada membro da matriz. Esse atributo será configurado quando a matriz for criada e poderá ser alterado com o comando charray.
Se o número de unidades sobressalentes adequadas pelas quais um membro da matriz é protegido incidir abaixo do objetivo sobressalente da matriz, você receberá um erro de evento 084300.
Configurações de prioridade de gravação lenta
Quando um nível de matriz redundante está executando operações de E/S de leitura/gravação, o desempenho da matriz é comprometido pelo desempenho da unidade de membro mais lenta. Quando as unidades executam os processos ERP internos, se a rede SAS estiver instável ou se um trabalho em excesso estiver sendo direcionado para a matriz, então o desempenho das unidades do membro poderá ser muito pior do que o normal. Nessa situação, as matrizes que oferecem redundância podem aceitar uma breve interrupção na redundância para evitar gravação ou leitura no componente mais lento. As gravações que são mapeadas para uma unidade de execução insatisfatória são confirmadas para a outra cópia ou paridade e são, então, concluídas com um status de satisfatório (presumindo nenhuma outra falha). Quando a unidade do membro é recuperada, a redundância será restaurada por um processo de segundo plano de gravar as faixas que foram marcadas como fora de sincronização enquanto o membro estava lento.
Essa técnica é controlada pela configuração do atributo slow_write_priority da matriz, que é padronizada para latency. Quando configurado como latency, a matriz tem permissão para ficar fora de sincronização em uma tentativa de suavizar o desempenho insatisfatório do membro. É possível usar o comando charray para mudar o atributo slow_write_priority para redundancy. Quando configurado para redundancy, não é permitido que a matriz fique fora de sincronização. No entanto, a matriz pode evitar a perda de desempenho de leitura retornando leituras para o componente lento a partir de caminhos redundantes.
Quando a matriz usa o modo latency ou tenta evitar a leitura de um componente no modo redundancy, o sistema avalia a unidade regularmente para verificar quando ela irá se tornar uma parte confiável do sistema novamente. Se a unidade nunca oferece bom desempenho ou se provoca muitas falhas de desempenho em na matriz, o sistema provoca falha no hardware para evitar a exposição contínua para a unidade de desempenho insatisfatório. O sistema falhará no hardware apenas se ele não puder detectar outra explicação para o mau desempenho da unidade.
Reconstrução incremental offline da unidade
Quando uma unidade permanece off-line em uma matriz RAID interna, o sistema não a substitui imediatamente por uma unidade hot-spare. Para um período de 60 segundos, a unidade marca onde ocorreram novas gravações. Se a unidade reaparecer online, ela concluirá uma "reconstrução incremental" dos locais em que as gravações ocorreram em vez de uma reconstrução integral do componente. Esta técnica ocorrerá independentemente da configuração slow_write_priority da matriz porque evitar um controle sobressalente é desejável manter a alta disponibilidade do sistema.
Substituição da Unidade
Uma unidade com um LED de falha aceso indica que a unidade foi marcada como com falha e não está mais em uso pelo sistema. Quando o sistema detecta que tal unidade com falha foi substituída, ele reconfigura a unidade de substituição para ser uma unidade sobressalente. A unidade com falha que foi substituída é automaticamente removida da configuração. A nova unidade sobressalente é, então, usada para cumprir os objetivos de associação da matriz do sistema.