圧縮ボリューム

ボリュームを作成するときに、ボリュームの容量を節約する 1 つの方法として圧縮を指定できます。圧縮ボリュームを使用すると、データがディスクへの書き込み時に圧縮されるため、さらにスペースを節約できます。 追加のメモリー・モジュール (16 GB DIMM) が取り付けられている

シン・プロビジョニング・ボリュームと同様に、圧縮ボリュームには、次のように仮想容量、実容量、および使用済み容量があります。 圧縮ボリュームを扱う前に、以下のガイドラインを使用してください。

  • 実容量 は、プールから割り振られるエクステント・スペースです。実容量は、ボリュームが作成されるときにも設定され、シン・プロビジョニング・ボリュームと同様に、拡張したり使用済み容量まで縮小したりすることができます。
  • 仮想容量 は、ホストが使用可能な容量です。仮想容量は、ボリュームの作成時に設定され、後で拡張または縮小することが可能です。HyperSwap® ボリュームの仮想容量は変更できません。ボリュームを拡張または縮小するには、ボリュームからコピーを削除して、HyperSwap ボリュームを基本ボリュームに変換する必要があります。そうすると、ボリュームをサイズ変更して、新規コピーを追加し直して、ボリュームを HyperSwap ボリュームに変換し直すことができます。
  • 使用済み容量 は、圧縮後にお客様データおよびメタデータを保管するために使用されている実容量です。
  • 圧縮前の容量 は、ボリュームに書き込まれた後で圧縮されたお客様のデータの量です。圧縮前の容量には、未割り振りスペースにゼロ・データが書き込まれる領域は含まれません。

また、圧縮使用量に関する情報をモニターして、ボリュームが圧縮されるときのストレージ容量の節約量を判別することもできます。システム全体の圧縮節約および容量をモニターするには、「モニター」 > 「システム」を選択します。圧縮が適用される前に使用される容量を、すべての圧縮ボリュームに使用される容量と比較できます。さらに、システムで圧縮が使用されている場合、節約されている容量の合計パーセンテージを表示することもできます。個々のプールおよびボリューム全体での圧縮による節約量をモニターすることもできます。ボリュームの場合、これらの圧縮値を使用して、最高の圧縮節約を達成したボリュームを判別することができます。

圧縮の利点

圧縮を使用すると、環境全体の物理ストレージの容量が減ります。 データのアーカイブや削除を行うことなく、既存のストレージ内の空きディスク・スペースを再使用することができます。

データをボリュームに書き込むときに圧縮すると、ストレージの単位当たりの環境要件も低減します。保管データに圧縮が適用された後では、同じ容量の物理ストレージに保管される論理データが増えるため、論理ストレージの単位当たりの電力および冷却の要件が低くなります。 特定のストレージ・システム内に、より多くのデータを保管することができるため、ラック・ユニット全体の要件が低減します。

圧縮は、既存の環境に影響を及ぼすことなく実装でき、ミラーリングされたボリュームやコピー・サービス機能などの他のストレージ・プロセスと一緒に使用できます。

圧縮ボリュームは、通常のボリュームと同等のレベルの可用性を提供します。圧縮は、サービスに影響を与えることなく既存の環境に実装することが可能で、ユーザーやアプリケーションが既存のデータにアクセスしている間にそのデータを透過的に圧縮することができます。

圧縮を使用する場合は、全体のパフォーマンスおよび CPU 使用率をモニターして、他のシステム機能に十分な帯域幅があることを確認してください。 圧縮が過度に使用されると、システム全体の帯域幅が影響を受ける可能性があります。 圧縮に関連するパフォーマンス統計を表示するには、「モニター」 > 「パフォーマンス」を選択し、次に「CPU 使用率」のグラフで「圧縮 (%)」を選択します。

圧縮ボリュームの一般的な用途

圧縮を使用すると、ブロック・ストレージおよびファイル・システムの両方の環境でストレージを統合することができます。 データの圧縮により、ボリュームおよびディレクトリーに必要な容量が削減されます。圧縮を使用すると、ログ・データのストレージ使用率を最小化することができます。 ラボ・テストの結果などの多くのアプリケーションでは、アプリケーション状況やユーザー状況を常時記録することが必要です。 一般的に、ログは、同じデータ・パターンが頻繁に繰り返されるテキスト・ファイルまたはバイナリー・ファイルとして表されます。

ボリューム・ミラーリングを使用することで、元のボリュームのコンテンツへのアクセスを中断することなく、完全に割り振り済みの既存のボリュームを圧縮ボリュームに変換することができます。 管理 GUI には、汎用ボリュームを圧縮ボリュームに変換する際の固有の指示が含まれます。

圧縮ボリュームの計画

ご使用のシステム上に圧縮ボリュームを実装する前に、システム上で使用しているデータおよびボリュームの現行タイプを確認してください。 通常のワークロードの一環として既に圧縮されているデータを圧縮しないでください。 ビデオ、圧縮ファイル形式 (.zip ファイル)、または圧縮されたユーザー・プロダクティビティー・ファイル形式 (.pdf ファイル) などのデータは、保存されるときに圧縮されています。 これらのタイプのファイルの圧縮にシステム・リソースを使用しても、さらに節約を実現することはほとんど不可能であるため、効果的ではありません。また、暗号化されたデータも圧縮することができません。

考慮する必要があるボリュームのタイプは 2 つ (同種と異種) あります。 通常、同種ボリューム は、圧縮の候補として適しています。 同種ボリュームには単一のアプリケーションによって作成されたデータが含まれており、これらのボリュームは同じ種類のデータを保管しています。 同種ボリュームの例としては、データベース・アプリケーション、E メール、およびサーバー仮想化データなどがあります。 異種ボリューム は、複数の異なるアプリケーションによって作成されたデータを含むボリュームで、さまざまなタイプのデータを含みます。 そのようなボリューム内にはさまざまなデータ・タイプが含まれているため、圧縮または暗号化されたデータがこれらのボリュームに保管されている状態があります。 そのような場合、圧縮することができないデータにシステム・リソースが使用される可能性があります。 異種ボリュームに、暗号化されていない圧縮可能なデータしか含まれていない場合を除いて、異種ボリュームの圧縮は行わないでください。

システムで現在圧縮が使用されていない場合、システムが自動的に構成を分析して、圧縮を使用する場合に予想されるストレージ節約量を判定します。 管理 GUI には、数学的アルゴリズムと統計アルゴリズムを使用してシステムで予想される圧縮節約量を求める、Comprestimator ユーティリティーが組み込まれています。 節約可能量の分析を使用すると、追加のストレージ・デバイスのコストを削減するのに、システムの圧縮ライセンスの購入が必要かどうかを判別できます。管理 GUI で圧縮節約量を見積もるには、「ボリューム」 > 「アクション」 > 「スペース節約」 > 「圧縮節約量の見積もり」を選択します。 例えば、単一ボリュームに対して analyzevdisk コマンドを実行できます。また、analyzevdiskbysystem コマンドを使用して、システム上のすべてのボリュームを分析できます。圧縮分析の完了後に作成されたボリュームは、圧縮節約量について個別に評価することができます。データがほとんど入っていないボリュームではなく、可能な限り多くのアクティブ・データが含まれているボリュームを分析対象とするようにしてください。アクティブ・データを分析することにより、正確性が高まり、すでに削除されたが装置上にまだ痕跡が残っている可能性がある古いデータを分析するリスクが軽減されます。

分析が完了すると、全ボリュームの見積もり節約量を示す、十分な分析対象データを含む節約量レポートをダウンロードできます。 このレポートには、システム上で現在構成されている全ボリュームがリストされ、予想される圧縮節約量が示されます。 レポートをダウンロードするには、「ボリューム」 > 「ボリューム」 > 「アクション」 > 「スペース節約」 > 「節約レポートのダウンロード」を選択します。lsvdiskanalysis コマンドを使用して結果を表示することもできます。個々の分析についてボリューム名または ID を指定することにより、すべてのボリュームまたは単一ボリュームの結果を表示できます。

さまざまな構成項目が、システム上の圧縮のパフォーマンスに影響します。 システム上で高い圧縮率とパフォーマンスを達成するには、以下のガイドラインを満たしていることを確認してください。
  • 小さい数 (10 から 20) の圧縮ボリュームしかない場合は、それらの圧縮ボリュームを 1 つの入出力グループ上で構成します。異なる入出力グループ間にボリュームを分割しないでください。
  • 複数の入出力グループがあるシステム上に多数の圧縮ボリュームが存在する場合は、入出力グループ間で圧縮ボリュームを分散して、必ずこれらのボリュームへのアクセスが入出力グループ間で均等になるようにしてください。
  • 圧縮可能なデータのみを識別および使用します。データ・タイプが異なると、圧縮率が異なるため、現在、システム上にある圧縮可能データを判別することが重要です。 圧縮可能データを見積もるツールを使用することができますし、あるいは一般的なアプリケーションおよびデータ・タイプについて一般的に知られた率を使用することもできます。 これらのデータ・タイプを圧縮ボリューム上に格納することにより、ディスク容量が節約され、システム上で圧縮を使用するメリットが増えます。 次の表は、共通アプリケーションおよびデータ・タイプの圧縮率を示しています。
    表 1. データ・タイプごとの圧縮率. 表 1 では、高い圧縮率を提供する一般的なデータ・タイプおよびアプリケーションの圧縮率について記載しています。
    データ・タイプ/アプリケーション 圧縮率
    データベース 最大 80%
    サーバー/デスクトップの仮想化 最大 75%
    エンジニアリング・データ 最大 70%
    E メール 最大 80%
  • 圧縮率にエラー・マージンを提供するために、追加のメタデータの圧縮ボリューム用に使用されるプールの容量を 10% 割り増しにします。
  • 同種ボリューム上で圧縮を使用します。
  • クライアント・ベース、ファイル・システム・ベース、またはアプリケーション・ベースの圧縮をシステム圧縮と一緒に使用しないでください。
  • 暗号化されたデータは圧縮しないでください。

前から存在するシステム内の既存の非圧縮・ボリュームのパフォーマンスに影響を与えずに圧縮・ボリュームを使用するためには、最初の圧縮・ボリュームが作成されるときにリソースが再割り振りされる方法を理解しておいてください。

圧縮には、ノード内に専用のハードウェア・リソースが必要です。これらのハードウェア・リソースは、圧縮が有効にされたり無効にされたりすると、割り当てられたり割り当て解除されたりします。 圧縮は、入出力グループの最初の圧縮・ボリュームが作成されれば必ず使用可能に設定され、最後の圧縮・ボリュームが入出力グループから削除されるときに使用不可に設定されます。

ホストとディスク間の非圧縮入出力を処理するのに使用できるハードウェア・リソースが減った場合、入出力グループ内のノードの CPU 使用率が常に特定の値を上回っているときは、圧縮ボリュームを作成しないでください。 圧縮ボリュームが作成される場合、入出力グループ内の既存の非圧縮ボリュームについてパフォーマンスが低下する可能性があります。

ホストのワークロードが大きくなっている期間に、管理 GUI の「モニター」 > 「パフォーマンス」を使用して、CPU 使用率を測定します。

サイズの制限

圧縮ボリュームには、以下のようなサイズの制限があります。新規または既存の圧縮ボリュームが最大サイズに近づいた場合、システムはアラートを発行します。

96 TB
個々の新規圧縮ボリュームの最大仮想サイズ。このサイズを超える新規圧縮ボリュームを作成することはできません。また、既存の圧縮ボリュームのサイズを、この値を超えて大きくすることはできません。クラスター内の 1 つ以上の圧縮ボリュームがこの限度を超えた場合、ユーザーはアラートを受け取ります。データの損失や破壊のリスクを減らすために、その圧縮ボリュームからデータを除去するアクションをすぐに実行してください。
120 TB
クラスター内の既存の圧縮ボリュームの最大仮想サイズ。クラスター内の圧縮ボリュームがこの値に近づくか、この値を超えた場合、システムはアラートを発行します。
重要: その圧縮ボリュームからすべてのデータを除去してデータの損失を防止するために、即時アクションが必要です。
128 TB
圧縮ボリュームの物理的な最大サイズ。

圧縮ボリュームからデータを移動する方法について詳しくは、フラッシュ、アラート、および情報の Web サイトを参照してください。