SAN ボリューム・コントローラー 2145-DH8 ブート・ドライブの問題の解決

ブート・ドライブに関するほとんどの問題を解決するには、次の解決手順を実行します。

始める前に

ノード・シリアル番号 (製品シリアル番号またはマシン・シリアル番号とも呼ばれる) は、2145-DH8 ノードの前面 (左側) の MT-M SN ラベル (マシン・タイプ - モデルおよびシリアル番号ラベル) に記載されています。ノード・シリアル番号は、製造時にシステム・ボードと 2 台のブート・ドライブそれぞれに記載されています。

SAN ボリューム・コントローラー・ソフトウェアは、開始時にシステム・ボードからノード・シリアル番号を読み取り (パネル名にノード・シリアル番号を使用する)、2 台のブート・ドライブに格納されているノード・シリアル番号と比較します。

特定のノード・エラーは、次の条件のもとで発生します。
  • 致命的ノード・エラー 543: 3 つのロケーションに格納されているノード・シリアル番号がいずれも一致しない場合。ノード・シリアル番号が正常であるとSAN ボリューム・コントローラー・ソフトウェアが認識するためには、システム・ボードのノード・シリアル番号が 2 つのブート・ドライブの少なくとも一方と一致している必要があります。
  • 致命的ノード・エラー 545: それぞれのブート・ドライブのノード・シリアル番号が互いに一致していますが、システム・ボードのノード・シリアル番号と異なっています。この場合は、システム・ボードのノード・シリアル番号が誤っているか、ブート・ドライブのノード・シリアル番号が誤っていることが考えられます。 例えば、システム・ボードが変更されたか、ブート・ドライブが別の 2145-DH8 ノードに属している場合が考えられます。
  • ノード・エラー 743: 2 つのブート・ドライブの一方が障害を起こしているか、欠落しているか、または他方のブート・ドライブと同期していないために、そのドライブからノード・シリアル番号を読み取ることができない場合。
  • ノード・エラー 744: ブート・ドライブの一方のノード・シリアル番号が、別の 2145-DH8 ノードに属していることを示している場合。ドライブ・スロット 1 と 2 の間でブート・ドライブが交換された場合、ノード・エラー 744 が発生します。
  • ノード・エラー 745: ブート・ドライブがサポートされないスロット内で検出された場合。 バージョン 7.3 の SAN ボリューム・コントローラー・ソフトウェアでは、ドライブ・スロット 3 から 8 はサポートされません。

このタスクについて

問題によってノード・エラー 743、744、または 745 が発生した場合は、管理 GUI の「モニター」>「イベント」パネルにイベントが表示されます。そのイベントの修正手順を実行してください。それ以外の場合は、技術員用ポートに接続してノードの MT-M SN ラベルを使用し、ブート・ドライブ・スロット情報を確認して問題を判別してください。

重要: ドライブ・スロットの「アクティブ」列に「はい」が示されている場合、オペレーティング・システムはそのドライブに依存しています。 最初にノードをシャットダウンせずにそのドライブを取り外さないでください。
  • スロット間でブート・ドライブを交換しないでください。
  • それぞれのブート・ドライブに、システム・ボードの VPD のコピーがあります。
  • ソフトウェア・アップグレードは、CCU 時の障害を回避するために、一度に 1 つのブート・ドライブに対して行われます。

手順

ブート・ドライブの問題を解決するには、次のステップを順に実行します。

  1. サポートされないスロット内にあるドライブを取り外します。可能な場合はドライブを正しいスロットに移動します。
  2. 可能な場合は、スロットから欠落していることが示されているドライブを取り付け直します。それ以外の場合は、ドライブを取り付け直すか、FRU ストックからのドライブに取り替えます。
  3. 間違ったノードにあるドライブがあれば、正しいノードに戻します。
    注: ノード・シリアル番号がシステム・ボード上のノード・シリアル番号と一致しない場合は、ドライブ・スロットの状況が wrong_node になります。MT-M SN ラベルのシリアル番号が、ドライブのノード・シリアル番号と一致する場合は、この状況を無視できます。
  4. 間違ったスロットにあるドライブがあれば、正しいスロットに戻します。
  5. 「障害」状況にあるスロット内のドライブを取り付け直します。状況が「障害」のままであれば、ドライブを FRU ストックからのものに取り替えます。
  6. ドライブ・スロットの状況が「非同期」で、「can_sync」列に「はい」が示されている場合は、次のどちらかを行います。
    • サービス・アシスタント GUI を使用して、ブート・ドライブを同期します。
    • コマンド・ライン・インターフェース (CLI) のコマンド satask chbootdrive -sync を使用します。
    • 「can_sync」列に「いいえ」が表示されている場合は、別のブート・ドライブの問題を先に解決する必要があります。

2145-DH8 システム・ボードの交換:

  1. SAN ボリューム・コントローラー 2145-DH8システム・ボードを交換します。

ブート・ドライブのどちらにも使用可能な SAN ボリューム・コントローラー・ソフトウェアが存在しない場合:

例えば、両方のブート・ドライブを FRU ストックから同時に交換した場合、どちらのブート・ドライブにも使用可能な SAN ボリューム・コントローラー・ソフトウェアがありません。 SAN ボリューム・コントローラー・ソフトウェアが実行されていない場合は、ノード状況 LED、ノード障害 LED、バッテリー状況 LED、およびバッテリー障害 LED がオフのままになります。

  1. 元のブート・ドライブの少なくとも一方を、使用可能な SAN ボリューム・コントローラー・ソフトウェアを備え、ノード前面の MT-M SN ラベルと一致するノード・シリアル番号を持つドライブと交換できない場合は、IBM リモート技術サポートにお問い合わせください。IBM リモート技術サポートの支援により、ブート可能 USB フラッシュ・ドライブを使用して SAN ボリューム・コントローラー・ソフトウェアをインストールできます。
    • 現場ベースの USB インストールを行うと、製造時にシステム・ボードに格納された値の検索によって、各ブート・ドライブに格納されたノード・シリアル番号と WWNN の修復も行われます。
    • このノードの WWNN が以前に変更されていた場合は、SAN ボリューム・コントローラー・ソフトウェアのインストールが完了した後、WWNN を再び変更する必要があります。例えば、 レガシー SAN ボリューム・コントローラー・ノードを交換した場合は、WWNN がレガシー・ノードのものに変更されています。サービス・アシスタント GUI またはコマンドを使用して SAN ボリューム・コントローラー・ソフトウェアをインストールした後、WWNN を再び変更できます。

ノード・シリアル番号のすべてのコピーが失われた場合:

例えば、システム・ボードと両方のブート・ドライブを同時に FRU ストックと交換した場合、ノード・シリアル番号のすべてのコピーが失われます。

  1. 元のノード・シリアル番号のコピーが少なくとも 1 つ存在するように、元のブート・ドライブのいずれか、または元のシステム・ボードを交換できない場合、現場ではノードを修理できません。 ノードを修理のために IBM に返却する必要があります。

タスクの結果

SAN ボリューム・コントローラー・ソフトウェアが FRU ドライブを自動的に初期化できない場合のみ、ドライブ・スロットの状況は未初期化になります。この状況は、他方のブート・ドライブのノード・シリアル番号が、システム・ボードのノード・シリアル番号と一致しない場合に起こる可能性があります。他方のブート・ドライブのノード・シリアル番号が、ノードの前面左側にある MT-M SN ラベルと一致している場合は、未初期化状態のブート・ドライブを他方のブート・ドライブから安全にレスキューできます。サービス・アシスタント GUI、または satask recuenode コマンドを使用して、ドライブをレスキューします。