Configurações de matriz

Uma matriz é uma configuração ou grupo ordenado de dispositivos físicos (unidades) que é usado para definir volumes ou dispositivos lógicos. Uma matriz é um tipo de MDisk que é composto de unidades de disco; estas unidades são membros da matriz. Um Redundant Array of Independent Disks (RAID) é um método de configuração de unidades de membros para criar sistemas de alta disponibilidade e alto desempenho.

O sistema suporta configurações de matriz não distribuída e distribuída. Em matrizes não distribuídas, unidades inteiras são definidas como unidades hot spare. Unidades hot spare são inativas e não processam E/S para o sistema até que ocorra uma falha de unidade. Quando uma unidade do membro falha, o sistema substitui automaticamente a unidade com falha por uma unidade hot-spare. O sistema então ressincroniza a matriz para restaurar sua redundância. No entanto, todas as unidades do membro dentro de uma matriz distribuída possuem uma área de reconstrução reservada para falhas na unidade. Todas as unidades em uma matriz podem processar dados de E/S e fornecer tempos de reconstrução mais rápidos quando uma unidade falha. O nível do RAID fornece diferentes graus de redundância e desempenho; Ele também determina o número de membros na matriz.

Se a criptografia estiver ativada no seu sistema, é possível criar matrizes criptografadas e matrizes distribuídas. Para obter mais informações, consulte Configurando a Criptografia.

A Figura 1 mostra os relacionamentos dos componentes da matriz no sistema.
Figura 1. Objetos da matriz
A figura mostra todos os objetos do sistema.

Matrizes

Uma matriz não distribuída pode conter de 2 a 16 unidades; várias matrizes criam a capacidade para um conjunto. Para que haja redundância, unidades hot spare são alocadas para assumir as operações de leitura ou gravação, caso alguma das outras unidades falhar. O resto do tempo, as unidades sobressalentes estão inativas e não processam solicitações para o sistema. Quando uma unidade do membro falha na matriz, os dados podem ser recuperados apenas para o sobressalente tão rápido quanto a unidade pode gravar os dados. Devido a esse gargalo, a reconstrução dos dados poderá levar muitas horas, pois o sistema tentará balancear o host e reconstruir a carga de trabalho. Como resultado, o carregamento no restante das unidades do membro pode aumentar significativamente. A latência de E/S na matriz de reconstrução é afetada durante todo esse tempo. Como os dados de volume são divididos nos MDisks, todos os volumes são afetados durante o tempo levado pra a reconstrução da unidade.

Matrizes distribuídas

As configurações de matrizes distribuídas criam MDisks internos de grande escala. Essas matrizes, que podem conter de 4 a 128 unidades, também contêm áreas de reconstrução que são usadas para manter redundância após uma unidade falhar. Se não houver unidades suficientes disponíveis no sistema (por exemplo, em configurações com menos de quatro unidades flash), não é possível configurar uma matriz distribuída. As matrizes RAID distribuídas resolvem os gargalos de reconstrução em configurações de matrizes não distribuídas porque as áreas de reconstrução são distribuídas entre todas as unidades na matriz. A carga de trabalho de gravação de reconstrução é dividida entre todas as unidades, em vez de ser colocada apenas em uma única unidade sobressalente, o que resulta em reconstruções mais rápidas em uma matriz. Matrizes distribuídas removem a necessidade de unidades separadas que estão inativa até que ocorra uma falha. Ao invés de alocar uma ou mais unidades como sobressalentes, a capacidade sobressalente é distribuída sobre áreas de reconstrução específicas em todas as unidades do membro. Os dados podem ser copiados de forma mais rápida na área de reconstrução e a redundância é restaurada muito mais rapidamente. Além disso, à medida que a reconstrução progride, o desempenho do conjunto é mais uniforme porque todas as unidades disponíveis serão utilizadas para cada extensão de volume. Após a substituição da unidade com falha, os dados são copiados de volta para a unidade da capacidade sobressalente distribuída. Ao contrário das unidades hot spare, as solicitações de leitura/gravação são processadas em outras partes da unidade, que não são utilizadas como áreas de reconstrução. O número de áreas de reconstrução é baseado na largura da matriz. O tamanho da área de reconstrução determina quantas vezes a matriz distribuída pode recuperar as unidades com falha sem risco de se tornar degradada. Por exemplo, uma matriz distribuída que usa unidades RAID 6 pode manipular duas falhas simultâneas. Após a reconstrução das unidades com falha, a matriz pode tolerar outras duas falhas de unidade. Se todas as áreas de reconstrução forem usadas para recuperar dados, a matriz ficará comprometida na próxima falha da unidade. Verifique se seu modelo suporta matrizes distribuídas antes de concluir a configuração de matriz. Para sistemas que suportam matrizes distribuídas, é possível usar a GUI de gerenciamento ou o comando expanarray para aumentar o número de unidades em uma matriz, incluindo novas unidades na matriz.

É possível expandir matrizes distribuídas para aumentar a capacidade disponível da matriz ou incluir capacidade utilizável. Como parte da expansão, o sistema migra automaticamente os dados, para que a nova configuração expandida tenha um desempenho ideal. A expansão de matrizes distribuídas suporta o crescimento incremental de capacidade disponível para matrizes e é compatível com outras funções, como as migrações de IBM® Easy Tier e de dados.

Diretrizes de configuração de matriz

A GUI de gerenciamento é automaticamente padronizada para o número recomendado de áreas de reconstrução que é baseado na largura atual e em outras configurações para a matriz distribuída. A largura da matriz inclui o número de unidades físicas e de áreas de reconstrução que são necessárias para assegurar a redundância se as unidades falharem. O sistema pode recomendar um máximo de quatro áreas de reconstrução para matrizes distribuídas para unidades conectadas por SAS e matrizes RAID distribuídas NVMe não compactadas. As matrizes RAID distribuídas NVMe compactadas suportam uma área de reconstrução. Outras configurações, como classe da unidade, também são usadas para determinar a melhor configuração para matrizes. Por exemplo, ao incluir armazenamento ou expandir uma matriz distribuída, a GUI de gerenciamento desativará quaisquer classes de unidades que forem incompatíveis com as unidades que já estão no conjunto. Depois, ela analisará a configuração de matriz atual no conjunto para recomendar larguras de faixa e contagens de unidade.

Após a configuração de sistema, deve-se configurar o armazenamento ao criar conjuntos e designar armazenamento a conjuntos específicos. Antes de designar o armazenamento, assegure-se de que os conjuntos tenham sido criados. Na GUI de gerenciamento, selecione Conjuntos > Ações > Incluir Armazenamento. A seleção Incluir Armazenamento configura automaticamente as unidades existentes nas matrizes.Use o comando lsarrayrecommendation para exibir as recomendações do sistema para configurar uma matriz. Para um maior controle e flexibilidade, é possível usar o comando da interface da linha de comandos (CLI) mkarray para configurar uma matriz não distribuída em seu sistema. Para configurar uma matriz distribuída, é possível usar o comando mkdistributedarray.