Volumes deduplicados

A deduplicação pode ser configurada com volumes thin-provisioned e compactados em conjuntos de redução de dados para economia de capacidade incluída. A deduplicação é um tipo de redução de dados que elimina cópias de dados duplicadas.

Com deduplicação, o sistema identifica chunks de dados exclusivos, chamados assinaturas, para determinar se novos dados são gravados no armazenamento. A deduplicação é uma solução baseada em hash, que significa que chunks de dados são comparados às suas assinaturas do que aos próprios dados. Se a assinatura dos novos dados corresponder a uma assinatura existente que está armazenada no sistema, os novos dados serão substituídos por uma referência. A referência aponta para os dados armazenados, em vez de gravar os dados para armazenamento. Este processo economiza capacidade no armazenamento de backend não gravando novos dados no armazenamento e pode melhorar o desempenho em operações de leitura em dados com uma assinatura existente. O mesmo padrão de dados pode ocorrer muitas vezes e a deduplicação reduz a quantidade de dados que precisam ser armazenados no sistema. Uma parte de cada solução de deduplicação baseada em hash é um repositório que suporta a consulta de correspondências para dados recebidos. O sistema contém um banco de dados que mapeia a assinatura dos dados para o volume e seu endereço virtual. Se uma operação de gravação recebida não tiver uma assinatura que esteja armazenada no banco de dados, uma duplicada não será detectada e os dados recebidos serão armazenados no armazenamento de backend. Para aumentar o espaço que está disponível para o banco de dados, o sistema distribui este repositório entre todos os nós nos grupos de E/S que contêm volumes deduplicados. Cada nó tem uma parte distinta dos registros que são armazenados no banco de dados. Se nós forem removidos ou incluídos no sistema, o banco de dados será redistribuído entre os nós para assegurar o uso total da memória disponível.

Quando criar um volume, é possível especificar para incluir deduplicação com outros métodos de economia de capacidade suportados, como compactação e thin-provisioning. Os volumes deduplicados devem ser criados em conjuntos de redução de dados. Se você tiver volumes existentes em conjuntos padrão, poderá migrá-los para conjuntos de redução de dados para incluir deduplicação para aumentar a economia de capacidade para o volume.