回復系統程序
如果系統狀態遺失,則回復系統程序會回復整個系統。 此程序使用已儲存的配置資料重建儲存體系統,並且稱為層級 3 (T3) 回復。已儲存的配置資料位於作用中的仲裁磁碟和最新 XML 配置備份檔中。 回復可能無法還原所有的磁區資料。
注意:
如果系統的狀態如下:
- 沒有節點處於作用中
請勿嘗試起始節點救援(使用者可以使用 服務助理 GUI 或 satask rescuenode 服務 CLI 指令,來起始節點救援)。請停止,並聯絡 IBM®® 遠端技術支援中心。在這個特定狀態下起始這項 T3 回復系統程序,會導致 XML 配置備份檔遺失。
小心:
- 請只在修正程序指示時,才執行服務動作。如果使用不當,服務動作可能會造成無法存取資料,甚至會失去資料。在您完成任何動作之前,請先閱讀並瞭解所有的指示。
- 如果系統使用大容量裝置作為仲裁裝置,回復程序可能需要數小時。
- 如果在執行回復程序後存在離線陣列,請聯絡 IBM 支援中心。.
除非符合下列條件,請勿嘗試執行回復系統程序:
- 符合何時執行回復系統程序中的所有條件。
- 所有硬體錯誤都已修正。請參閱修正硬體錯誤
- 所有節點都為候選狀態。否則,請參閱步驟 1。
- 所有節點的程式碼層次,必須與系統在失效之前的相同。若有節點已修改或已更換,請使用服務助理來驗證程式碼層次,必要時,請重新安裝程式碼層次,以符合系統中之其他節點所執行的層次。如需相關資訊,請參閱使用服務助理移除具有錯誤碼 550 或錯誤碼 578 之節點的系統資訊。
- 如果系統針對 T3 meta 資料使用 IP 仲裁,請驗證所有 IP 仲裁應用程式皆在執行中。
系統回復程序是幾項必須完成之作業中的一項。下列清單是作業概觀,以及必須完成的作業順序:
- 準備進行系統回復:
- 請檢閱有關何時執行回復系統程序的資訊。
- 請修正硬體錯誤,並確定系統中的所有節點都會顯示在服務助理或 sainfo lsservicenodes 的輸出中。
- 使用服務助理,移除存在錯誤碼 550 或 578 之節點的系統資訊,但是請務必遵循針對這些節點錯誤所建議的使用者回應來執行。
- 對於虛擬磁區 (VVol),請針對連接至系統的任何 Spectrum Control Base 實例,關閉其服務。請使用 Spectrum Control Base 指令 service ibm_spectrum_control stop。
- 啟動回復程序之前,將緊急備用節點從系統中移除,並設為候選模式。執行下列 CLI 指令從系統中卸下節點。
當節點回到服務模式後,執行下列 CLI 指令將節點設為候選模式。satask leavecluster -force spare-node-panel-namesatask stopservice spare-node-panel-name
- 執行系統回復。在您準備執行系統回復,且已符合所有先決條件之後,請執行系統回復。註: 請在光纖中,一次在一個系統上執行這項程序。請勿在同一個系統中的不同節點上執行這項程序。這項限制也適用於遠端系統。
- 完成動作,讓您的環境可以運作。
- 使用 CLI,從離線磁區來回復。
- 例如,檢查您的系統,確定所有對映磁區都能存取主機。
- 何時執行回復系統程序
只有在完全徹底調查系統失效的原因之後,才能嘗試執行回復程序。請嘗試使用其他服務程序,來解決這些問題。 - 修正硬體錯誤
請務必先找出並修正硬體問題的主要原因,然後再執行系統回復程序。 - 使用服務助理移除具有錯誤碼 550 或錯誤碼 578 之節點的系統資訊
只有當要回復之節點的系統中所有節點都處於候選狀態時,系統回復程序才能運作。如果有任何的節點顯示錯誤碼 550 或錯誤碼 578,您必須移除其系統資料。 - 使用服務助理來執行系統回復
當作為系統成員的所有節點都在線上,並處於候選狀態時,您可以使用服務助理來啟動回復。若有節點顯示錯誤碼 550 或 578,請移除系統資訊,以便將它們置於候選狀態。請勿在同一系統中的不同節點上,執行回復程序;這項限制包括遠端系統在內。 - 使用 CLI 從離線磁區進行回復
如果離線磁區完成層級 3 回復程序,則在導致所有節點機匣失去區塊儲存體系統叢集狀態的失敗期間,節點機匣的寫入快取中的資料很有可能流失。您可以使用指令行介面 (CLI) 來確認寫入快取流失了資料,並使磁區回到線上,以試圖處理資料流失。 - 執行系統回復之後的檢查事項
使用系統之前必須完成幾項作業。
上層主題: 疑難排解