MAP 5800: ライト・パス

MAP 5800: ライト・パスは、SAN ボリューム・コントローラー 2145-DH8 がブートするのを妨げるハードウェア障害を解決するのに役立ちます。

始める前に

これらの保守分析手順 (MAP) に慣れていない場合は、まず 保守分析手順の使用 をお読みください。

ここに送られてきたのは、以下の状態が理由である可能性があります。

SAN ボリューム・コントローラー 2145-DH8 用のライト・パス

ライト・パス診断プログラムは、SAN ボリューム・コントローラー 2145-DH8ノードの オペレーター情報パネルの上部にある一連の LED であり、これにより、障害が発生したコンポーネントに行き着きます。

このタスクについて

エラーが発生すると、LED は、オペレーター情報パネルの前面、ライト・パス診断パネル、次に、障害が発生したコンポーネントで点灯します。LED を特定の順序で確認することにより、エラーの元を特定できる場合が少なくありません。

ノードが、稼働中の電源機構に接続されている場合、エラーを示すために点灯する LED は、サーバーの電源がオフのときでも点灯したままになります。

ノードの電源がオフであることを確認してから、エラー LED およびライト・パス LED が示すハードウェア・エラーがあればすべて解決します。

手順

  1. SAN ボリューム・コントローラー 2145-DH8 オペレーター情報パネル図 1 に示されているシステム・エラー LED  7  は点灯していますか、それとも明滅していますか?
    図 1. SAN ボリューム・コントローラー 2145-DH8 オペレーター情報パネル
    SAN ボリューム・コントローラー 2145-DH8 オペレーター情報パネル
    •  1  「電源制御」ボタンと LED。
    •  2  イーサネット LED。
    •  3  「ロケーター」ボタンと LED。
    •  4  解放ラッチ。
    •  5  イーサネット活動 LED。
    •  6  チェック・ログ LED。
    •  7  システム・エラー LED。
    いいえ
    症状を見直して、MAP 5000: 開始に戻ります。
    はい
    ステップ 2 に進みます。
  2. (ステップ 1 から)
    図 2 に示されている解放ラッチを押して、ライト・パス診断パネルを開きます。これは、図 3 に示されています。
    図 2. 解放ラッチを押す
    解放ラッチを押す
    ライト・パス診断パネルで 1 つ以上の LED が明滅していますか?
    図 3. SAN ボリューム・コントローラー 2145-DH8 ライト・パス診断パネル
    SAN ボリューム・コントローラー 2145-DH8ライト・パス診断パネル
    いいえ
    オペレーター情報パネル・ケーブルが両端に正しく配置されているかを確認します。エラー LED がまだ点灯しているが、ライト・パス診断パネルで LED が点灯していない場合は、以下の順で部品を交換します。
    1. オペレーター情報パネル
    2. システム・ボード
    MAP 5700: 修復検査を続行して修復結果を検証します。
    はい
    表 1 を参照して、特定のライト・パス診断 LED 用に指定されたアクションを実行します。その後、ステップ 3 に進みます。アクションによっては、システム・ボード上の LED 状態を監視している必要があります。図 4 は、システム・ボード LED の位置を示しています。ファン LED は、各ファンの横にあります。LED を確認するには、以下のアクションを実行します。
    1. ノードの電源をオフにする前に、そのノードのデータがミラーリングおよび同期化されていることを確認してください。
    2. ノードに接続されているすべてのケーブルを識別し、ラベルを付けて、同じポートに再取り付けできるようにします。ラックからノードを取り外し、平らな帯電防止面におきます。
    3. 上部カバーを取り外します。
    4. 表 1 を参照して、特定のライト・パス診断 LED 用に指定されたアクションを実行します。その後、ステップ 3 に進みます。
    図 4. SAN ボリューム・コントローラー 2145-DH8 システム・ボード LED
    SAN ボリューム・コントローラー 2145-DH8 システム・ボード LED
    表 1. 診断パネル LED
    LED 説明 アクション
    エラー・ログまたはチェック・ログ LED

    オペレーター情報パネル

    エラーが発生しており、特定の手順を実行しないと、特定できません。
    1. VGA 画面と USB キーボードを接続します。
    2. エラーに関する情報がないか、IMM2 システム・イベント・ログとシステム・エラー・ログを調べます。
    3. 必要に応じてログを保存し、その後、ログを消去します。
    システム・エラー LED

    オペレーター情報パネル

    エラーが発生しました。
    1. ライト・パス診断 LED を調べて、指示に従います。
    2. エラーに関する情報がないか、IMM2 システム・イベント・ログとシステム・エラー・ログを調べます。
    3. 必要に応じてログを保存し、その後、ログを消去します。
    PS PS LED のみが点灯している場合、電源機構に障害が発生しています。 システムが電源機構エラーを検出している可能性があります。 以下のステップを実行して、問題を修正します。
    1. 黄色の LED が点灯しているパワー・サプライを確認します。
    2. パワー・サプライが正しく装着されており、正常な AC コンセントに接続されていることを確認します。
    3. 電源機構を取り外して、障害のある電源機構を切り分けます。
    4. サーバーに取り付けられている 2 つの電源機構が同じ AC 入力電圧のものであることを確認します。
    5. 障害が起きた電源機構を交換します。
    PS + CONFIG

    PS LED と CONFIG LED の両方が点灯している場合は、電源機構構成が無効です。

    PS LED と CONFIG LED が点灯している場合、システムは、無効な電源構成エラーをログに記録します。ノードに取り付けられている 2 つの電源機構が同じ定格またはワット数のものであることを確認します。
    OVER SPEC システム使用量が電源機構の過電流保護ポイントに達したか、あるいは電源機構が損傷しています。
    1. 電源レール (A、B、C、D、E、F、G、および H) エラーが検出されなかった場合は、以下のステップを実行します。
      1. IBM Systems Energy Estimator を使用して、現行システムの電力消費量を判別します。 詳しくは、以下の Web サイトを参照してください。

        https://www-947.ibm.com/systems/support/tools/estimator/energy/index.html

      2. 障害が起きた電源機構を交換します。
    2. 電源レール (A、B、C、D、E、F、G、および H) エラーも検出されている場合は、「MAP 5040: 電源 SAN ボリューム・コントローラー 2145-DH8」にリストされているアクションを実行します。
    PCI PCI バスまたはシステム・ボードでエラーが発生しました。障害のある PCI スロットの隣にある別の LED が点灯します。
    1. ライザー・カード LED、ServeRAID エラー LED、およびデュアル・ポート・ネットワーク・アダプター・エラー LED を調べて、エラーの原因となっているコンポーネントを特定します。
    2. このエラーに関する情報がないか、システム・エラー・ログを調べます。
    3. LED およびシステム・エラー・ログに記載されている情報を使用しても障害が発生しているコンポーネントを特定できない場合は、一度に 1 つずつコンポーネントを取り外します。そして、各コンポーネントを取り外した後で、サーバーを再始動してください。
    4. 以下のコンポーネントを、示されている順に交換し、そのたびにサーバーを再始動します。
      • PCI ライザー・カード
      • ServeRAID アダプター
      • ネットワーク・アダプター
      • (トレーニングを受けた技術員) システム・ボード
    5. 障害が残っている場合は、IBM® サービス担当員に連絡します。
    NMI マスク不可能割り込みが発生したか、「NMI」ボタンが押されました。
    1. このエラーに関する情報がないか、システム・エラー・ログを調べます。
    2. サーバーを再始動します。
    CONFIG CONFIG と PS: 無効な電源構成エラーが発生しました。 CONFIG LED と PS LED が点灯している場合、システムは、無効な電源構成エラーをログに記録します。サーバーに取り付けられている 2 つの電源機構が同じ定格またはワット数のものであることを確認します。
    CONFIG + CPU: ハードウェア構成エラーが発生しました。 CONFIG LED と CPU LED が点灯している場合は、以下の手順を実行して、問題を修正します。
    1. 取り付けられていたマイクロプロセッサーを調べて、それらが互いに互換性のあるものであることを確認します。
    2. (トレーニングを受けた技術員) 互換性のないマイクロプロセッサーを取り替えます。
    3. このエラーに関する情報がないか、システム・エラー・ログを調べます。エラー・ログで特定されているすべてのコンポーネントを取り替えます。
    CONFIG と MEM: ハードウェア構成エラーが発生しました。 CONFIG LED と MEM LED が点灯している場合は、Setup ユーティリティーのシステム・イベント・ログまたは IMM2 エラー・メッセージを調べます。
    CONFIG + PCI: ハードウェア構成エラーが発生しました。 CONFIG LED と PCI LED が点灯している場合、システム・エラー・ログでエラーに関する情報がないかを確認します。 エラー・ログで特定されているすべてのコンポーネントを取り替えます。
    CONFIG と HDD: ディスク・ドライブ・エラーが発生しました。 CONFIG LED と HDD LED が点灯している場合、システム・エラー・ログでエラーに関する情報がないかを確認します。 エラー・ログで特定されているすべてのコンポーネントを取り替えます。
    LINK 予約済み。
    CPU CPU LED のみが点灯している場合、マイクロプロセッサーに障害が起きました。 CPU LED と CONFIG LED の両方が点灯している場合は、マイクロプロセッサー構成が無効です。
    1. CONFIG LED が点灯していない場合は、マイクロプロセッサー障害が発生しています。以下のステップを実行して問題を修正します。
      1. (トレーニングを受けた技術員のみ) 障害のあるマイクロプロセッサーとそのヒート・シンク (システム・ボード上の LED が点灯して示されます) が正しく取り付けられていることを確認します。
      2. (トレーニングを受けた技術員のみ) 障害のあるマイクロプロセッサーを交換します。
      3. 詳しくは、IBM サービス担当員にお問い合わせください。
    2. CONFIG LED と CPU LED が点灯している場合、システムは、無効なマイクロプロセッサー構成エラーをログに記録します。この問題を修正するには、以下のステップを実行してください。
      1. 最近取り付けられたマイクロプロセッサーを調べて、相互に互換性があることを確認します。
      2. (トレーニングを受けた技術員のみ) 互換性のないマイクロプロセッサーを交換します。
      3. このエラーに関する情報がないか、システム・エラー・ログを調べます。エラー・ログで特定されているすべてのコンポーネントを取り替えます。
    MEM MEM LED のみが点灯している場合、メモリー・エラーが発生しています。
    注: 注: DIMM の取り付けまたは取り外しのたびに、ノードを給電部から切り離し、10 秒待ってから、サーバーを再始動する必要があります。
    CONFIG LED が点灯していない場合は、システムがメモリー・エラーを検出する可能性があります。以下の手順を実行して、問題を修正してください。
    1. ノード・ファームウェアを更新します。
    2. LED が点灯している DIMM を取り付け直すか、または交換します。
    3. Setup ユーティリティーのシステム・イベント・ログまたは IMM エラー・メッセージを調べます。
    4. 障害が発生している DIMM を取り替えます。
    MEM と CONFIG

    MEM LED と CONFIG LED の両方が点灯している場合は、メモリー構成が無効です。

    MEM LED と CONFIG LED が点灯している場合は、Setup ユーティリティーのシステム・イベント・ログまたは IMM2 エラー・メッセージを調べます。
    TEMP システムまたはシステム・コンポーネントの温度がしきい値のレベルを超えました。ファンの障害が原因で、TEMP LED が点灯している可能性があります。
    1. ヒートシンクが正しく取り付けられていることを確認します。
    2. ファンに障害が発生したのかどうかを確認し、必要であれば該当のファンを取り替えます。
    3. 室温が高すぎないか確認します。サーバー温度情報については、環境要件を参照してください。
    4. 通風孔がふさがっていないか確認します。
    5. アダプターのヒート・シンクまたはファン、あるいはその他のネットワーク・アダプターが正しく取り付けられていることを確認します。ファンに障害が発生している場合は、そのファンを取り替えます。
    6. 詳しくは、IBM サービス担当員にお問い合わせください。
    FAN ファンに障害が起きたか、ファンの作動が非常に低速になっているか、またはファンが取り外されました。TEMP LED も点灯している場合があります。
    1. ご使用のノードが、デュアル・ポート・ネットワーク・アダプター付きで取り付けられているかどうかを調べます。 アダプター付きの場合は、そのノードが、4 つのファンが取り付けられた構成でコンパイルすることを確認してください。
    2. システム・ボード上のファン・コネクターの近くにある LED の点灯で示される、障害が起きたファンを取り付け直します。
    3. 障害が発生しているファンを取り替えます。
    BOARD システム・ボードまたはシステム・バッテリーでエラーが発生しました。
    1. システム・ボード上の LED を調べて、エラーの原因となったコンポーネントを識別します。BOARD LED が点灯する理由は、以下のいずれかである可能性があります。
      • バッテリー
      • (トレーニングを受けた技術員) システム・ボード
    2. このエラーに関する情報がないか、システム・エラー・ログを調べます。
    3. 障害が発生しているコンポーネントを取り替えます。
    HDD ハード・ディスクが障害を起こしたか、または欠落しています。
    1. 状況 LED が点灯しているドライブがないかハード・ディスクの LED を調べ、該当のハード・ディスクを取り付け直します。
    2. ハード・ディスク・バックプレーンを取り付け直します。
    3. エラーが残る場合は、リストされている順に、以下のコンポーネントを一度に 1 つずつ取り替え、そのたびにサーバーを再始動します。
      1. ハード・ディスクを取り替えます。
      2. ハード・ディスク・バックプレーンを取り替えます。
    4. 問題が解決しない場合は、IBM サービス担当員に連絡します。
  3. MAP 5700: 修復検査を続行して、操作が正しいかどうかを検証します。