解決使用 SAN Volume Controller 啟動磁碟機時發生的問題

請完成下列步驟以解決使用 SAN Volume Controller 啟動磁碟機時發生的大部分問題。

開始之前

節點序號(也稱為產品或機器序號)位於節點正面(左側)的 MT-M S/N 標籤(「機型 - 型號和序號」標籤)上。在製造過程中,會將節點序號寫入主機板及每個啟動磁碟機(共兩個)中。

SAN Volume Controller 軟體啟動時,它會從主機板讀取節點序號(將節點序號用作面板名稱),並比較此序號與儲存在兩個啟動磁碟機上的節點序號。

在下列狀況下,會產生特定的節點錯誤:
  • 無法復原的節點錯誤 543:此錯誤指出這三個位置中儲存的所有節點序號都不相符。主機板中的節點序號必須至少與兩個啟動磁碟機之一的節點序號相符, SAN Volume Controller 軟體才會認為節點序號有效。
  • 無法復原的節點錯誤 545:此錯誤指出每個啟動磁碟機上的節點序號彼此相符,但與主機板中的節點序號不同。 在此情況下,主機板上的節點序號可能錯誤,或啟動磁碟機上的節點序號可能錯誤。 例如,主機板已變更,或啟動磁碟機來自另一個節點。
  • 節點錯誤 743:此錯誤指出無法從兩個啟動磁碟機之一讀取節點序號,因為該磁碟機發生故障、缺失或未與另一個啟動磁碟機同步。
  • 節點錯誤 744:此錯誤指出其中一個啟動磁碟機的節點序號識別為屬於另一個節點。如果已在磁碟機槽 1 和 2 之間交換啟動磁碟機,則會產生節點錯誤 744。
  • 節點錯誤 745:此錯誤指出某個啟動磁碟機位於不受支援的插槽中。當前兩個磁碟機中至少有一個在線上,且佔用了至少一個無效的插槽 (3-8) 時,就會發生此錯誤。

關於這項作業

如果問題導致產生節點錯誤 743、744 或 745,則管理 GUI 的「監視 > 事件」畫面中會顯示事件。 請執行該事件的修正程序。否則,連接至技術人員埠以使用節點上的 MT-M S/N 標籤來查看啟動磁碟機插槽資訊並判斷問題。

小心: 如果磁碟機槽的 Active 直欄為 Yes,則表示作業系統依賴於該磁碟機。 在沒有先關閉節點的情況下,請勿卸下該磁碟機。
  • 請勿在插槽之間交換啟動磁碟機。
  • 每一個啟動磁碟機在主機板上都有一個 VPD 副本。
  • 一次對一個啟動磁碟機進行軟體升級,以防止在 CCU 期間發生故障。

程序

若要解決使用啟動磁碟機時發生的問題,請依序完成下列步驟:

  1. 卸下位於不受支援插槽中的任何磁碟機。如果可以,將磁碟機移至正確的插槽。
  2. 盡可能從插槽中更換掉顯示為缺失的任何磁碟機。否則,請重新安置磁碟機或將其更換為 FRU 庫存中的磁碟機。
  3. 將位於錯誤節點中的任何磁碟機移回正確的節點中。
    註: 如果節點序號不符合主機板上的節點序號,則磁碟機槽的狀態為 wrong_node。如果 MT-M S/N 標籤上的序號符合磁碟機上的節點序號,則可以忽略此狀態。
  4. 將位於錯誤插槽中的任何磁碟機移回正確的插槽中。
  5. 在狀態為 failed 的任何插槽中重新安置磁碟機。 如果狀態仍然為 failed,請將磁碟機更換為 FRU 庫存中的磁碟機。
  6. 如果磁碟機槽的狀態為 out of synccan_sync 直欄為 Yes,請執行下列動作:
    • 使用服務助理 GUI 來同步化啟動磁碟機,或者
    • 使用指令行介面 (CLI) 指令 satask chbootdrive -sync
    • 如果 can_sync 直欄顯示 No,則您必須先解決另一個啟動磁碟機問題。

更換主機板:

  1. 更換 SAN Volume Controller 2145-DH8 SAN Volume Controller 2145-SV1 主機板。

當兩個啟動磁碟機都沒有可用的 SAN Volume Controller 軟體時:

例如,如果您同時更換來自 FRU 庫存的兩個啟動磁碟機,但兩個啟動磁碟機都沒有可用的 SAN Volume Controller 軟體。 如果 SAN Volume Controller 軟體不在執行中,則節點狀態 LED、節點故障 LED、電池狀態 LED 及電池故障 LED 會保持熄滅。

  1. 如果您無法將至少一個原始啟動磁碟機更換為包含可用 SAN Volume Controller 軟體且具有與節點正面之 MT-M S/N 標籤相符的節點序號的磁碟機,請聯絡 IBM® 遠端技術支援人員。
    IBM 遠端技術支援人員可以協助您使用可啟動 USB 快閃記憶體隨身碟來安裝 SAN Volume Controller 軟體。
    • 現場型 USB 安裝還會透過尋找製造期間儲存在主機板上的值來修復每個啟動磁碟機上儲存的節點序號和 WWNN。
    • 如果之前變更了此節點的 WWNN,則在完成 SAN Volume Controller 軟體安裝之後,必須再次變更 WWNN。例如,如果節點更換了先前的 SAN Volume Controller 節點,則您必須將 WWNN 變更為先前節點的 WWNN。 在安裝 SAN Volume Controller 軟體之後,您可以使用服務助理 GUI 或利用指令來重複進行 WWNN 變更。

當節點序號的每個副本都丟失時:

例如,如果您同時將主機板和兩個啟動磁碟機更換為 FRU 庫存中的主機板和啟動磁碟機,則會丟失節點序號的每個副本。

  1. 如果您無法更換其中一個原始啟動磁碟機或原始主機板,從而存在至少一個原始節點序號副本,則無法現場維修節點。請將節點送回 IBM 以進行維修。

結果

僅當 SAN Volume Controller 軟體可能未自動起始設定 FRU 磁碟機時,磁碟機的狀態才會為 uninitialized。如果另一個啟動磁碟機上的節點序號不符合主機板上的節點序號,則會出現此狀態。如果另一個啟動磁碟機上的節點序號與節點左側正面上的 MT-M S/N 標籤相符,則可以安全地從另一個啟動磁碟機來救援未起始設定的啟動磁碟機。使用服務助理 GUI 或 satask rescuenode 指令來救援磁碟機。