更新系統軟體

系統更新程序涉及整個系統環境的更新。此程序可能涉及記憶體和軟體變更。

從這裡開始從 7.7.0 版或更新版本更新至 8.2.0 版或更新版本。

如果您是從 8.2.0 版之前的版本更新,請遵循該舊版中的指示。

規劃考量

如需更新之前限制的最新相關資訊,請參閱下列網站:

http://www.ibm.com/support/docview.wss?uid=ssg1S1001707

請酌留最多一週的時間來規劃您的作業,逐一完成預備的更新作業,然後完成系統環境的更新。更新程序可以劃分為表 1 中所示的一般程序。
表 1. 更新作業
順序 更新作業
1 在更新之前,請熟悉所涉及的必要條件和作業。 在自動更新程序期間,系統會有系統地更新每一個節點。決定您要自動更新還是手動更新。 在自動更新程序期間,系統會有系統地更新每一個節點。更新節點上軟體的偏好程序是自動方法。不過,您也可以手動更新每一個節點。
2 請確定 CIM 物件管理程式 (CIMOM) 用戶端運作正確。必要時,請更新這些用戶端,讓它們可以支援系統程式碼的新版本。
3 請確定環境中的多重路徑驅動程式是完全備援的。
4 更新您的系統。系統更新套件括元件韌體的更新。磁碟機韌體更新是一項個別的程序。
5 更新系統環境中的其他裝置。例如,將主機和交換器更新至正確的層次。
註: 時間量會因所需的準備工作量及環境的大小而有所不同。若為自動更新,每個節點大約需要 20 分鐘,外加每個系統各需 30 分鐘。30 分鐘的間隔時間可讓多重路徑軟體進行回復。
小心: 如果您的多重路徑驅動程式支援發生失效接手問題,請先解決這些問題,再啟動正常的作業。

系統及其連接之配接卡的韌體和軟體,是當成單一套件來測試和發佈。每次發佈新版本時,套件編號就會增加。

部分程式碼層次僅支援從特定的先前層次進行更新,或程式碼只能安裝在特定硬體類型上。如果要更新至高於現行層次一個以上的層次,您可能需要安裝中間層次。例如,如果您要從層次 1 更新至層次 3,則您可能需要先安裝層次 2 ,才能安裝層次 3。如需每一個程式碼層次之必要條件的相關資訊,請參閱下列網站:

www.ibm.com/support
小心: 請確定日誌中不存在未修正的錯誤,且系統的日期和時間設定正確。啟動修正程序,並確定在您嘗試並行更新程式碼之前,已修正所有未解決的錯誤。
註: 在系統軟體更新完成之後,您可以使用管理 GUI,遵循這些事件的修正程序,來在每一個節點上啟用「乙太網路光纖通道 (FCoE)」功能(如果已安裝的話)。在 FCoE 啟動程序過程中,需要將節點重新開機。在您要啟動相同 I/O 群組中的不同節點時,請在那段間隔時間中酌留一些時間,以便回復主機多重路徑。

多重路徑驅動程式

在更新之前,請確保多重路徑驅動程式是完全備援的,且每個路徑都可用且在線上。在更新期間,您可能會看到與消失(失效接手)的路徑相關的錯誤,且錯誤計數不斷增加。當節點路徑恢復時,節點會撤回成為完全備援的系統。等延遲 30 分鐘之後,另一個節點的路徑會調降。

如果您以 IBM® 子系統裝置驅動程式 (SDD)IBM 子系統裝置驅動程式裝置特定模組 (SDDDSM),作為主機上的多重路徑軟體,則會以 datapath query devicedatapath query adapter 指令來顯示增加的 I/O 錯誤計數,以監視多重路徑軟體的狀態。如需相關資訊,請參閱 IBM 多重路徑子系統裝置驅動程式使用手冊,以取得 datapath query 指令的相關資訊。

如果您以 IBM 子系統裝置驅動程式路徑控制模組 (SDDPCM),作為主機上的多重路徑軟體,則會以 pcmpath query devicepcmpath query adapter 指令來顯示增加的 I/O 錯誤計數,以監視多重路徑軟體的狀態。

Metro MirrorGlobal Mirror 關係

如果系統的主要或次要磁區會執行 Metro Mirror 或 Global Mirror 關係,當您在該系統上更新軟體時,主要磁區上的寫入效能可能會下降,Global Mirror 關係可能會因一或多個錯誤(錯誤碼 1920)而自動停止。您可能希望在更新軟體之前,主動停止此類關係或一致性群組或夥伴關係,以避免寫入效能下降,並在完成更新之後,重新啟動這些關係。

使用系統 6.4.0 版或更新版本時,對四個「光纖通道」及兩個「乙太網路光纖通道 (FCoE)」埠的支援已啟用。如果系統含有這些軟體版本,就無法與執行 6.4.0 之前版本的軟體的另一個系統建立遠端副本夥伴關係。如果執行 6.4.0 或更新版本的系統,與執行舊版軟體的另一個系統之間已具有遠端副本夥伴關係,則您無法新增一個其「光纖通道」埠和 FCoE 埠合計超過四個的節點。此外,您也無法在系統中的現有節點上,啟動更多的埠(無論是藉由啟用 FCoE 還是安裝新硬體)。如果要解決這些問題,您有下列兩種選項:
  • 將遠端系統上的軟體更新至 6.4.0 或更新版本,或者
  • 使用 chnodehw -legacy CLI 指令,在已安裝 6.4.0 或更新版本軟體之系統中的節點上,停用額外的硬體

    chnodehw CLI 的 -legacy 參數用來控制啟動和關閉 FCoE 埠。

如果要啟動額外的硬體,請執行下列 CLI 指令:
chnodehw node id
其中 node_name | node_id(必要)指定要修改的節點。參數後面的變數可以是:
  • 在您新增節點至系統時,您所指派的節點名稱。
  • 指派給節點的節點 ID(不是全球節點名稱)。
如果要停用額外的硬體,請執行下列指令:
chnodehw -legacy software_level node_id
其中 software_level 指出節點必須與其交互運作的軟體層次。如果該值低於 6.4.0,則節點會將其硬體配置為僅支援最多 4 個光纖通道埠或 FCoE 埠。node_name | node_id(必要)指定要修改的節點。參數後面的變數可以是:
  • 在您新增節點至系統時,您所指派的節點名稱
  • 指派給節點的節點 ID(不是全球節點名稱)
由於在代碼為 6.4.0 的每個節點上支援 6 個埠(4 個光纖通道埠和 2 個 FCoE 埠),所以規則規定了如何設定與低於 6.4.0 的系統的夥伴關係。
  • 6.4.0 系統無法與 6.4.0 之前並啟用了 4 個以上 FC/FCoE I/O 埠的系統形成夥伴關係。
    例如,A、B 和 C 三個系統之間的多重系統夥伴關係配置。
    A <-> B<-> C
    系統 A 安裝了 6.4.0 之前的版本,而系統 B 和 C 安裝了 6.4.0 版本。
    在這種配置中,只有在系統 B 沒有啟用 FCoE 埠的情況下,才有可能執行遠端副本服務。
    系統 A 和 B 之間的夥伴關係將不受影響,因為啟動 FCoE 埠的是系統 C 中的節點。
  • 如果 6.4.0 系統已建立與低於 6.4.0 的系統的夥伴關係,並且在停止該夥伴關係時啟用了更多硬體(4 個光纖通道埠和兩個 FCoE 埠),則在已更新遠端系統或使用 chnodehw -legacy 指令停用額外的硬體之前,將無法再次啟動該夥伴關係。
  • 如果節點使用較舊的硬體配置(包括已從 6.3.0 已更新到 6.4.0,且具有 10 Gb 乙太網路配接卡的系統),可能會產生事件日誌,指出有新的硬體(FCoE 功能)可用,而應該使用 chnodehw 指令來啟用。如果您想繼續與使用舊層次軟體的系統維持遠端副本夥伴關係,請不要修正這個事件日誌。

如果啟動了額外的硬體,且需要與執行 6.4 之前軟體的系統建立夥伴關係,則必須先使用 chnodehw -legacy software version (pre 6.4) node id 指令,停用額外的硬體。

將節點新增至系統時,系統會檢查是否有(已啟動的)夥伴關係,並判斷夥伴系統的最低軟體層次。會將這個軟體層次傳遞給要新增至系統的節點。在節點加入系統時,會處理等同於 chnodehw -legacy software level 的指令。

更新程序

在自動更新程序期間,會逐一更新系統中的每一個節點,且新的程式碼會暫置於節點上。當每一個節點重新啟動時,系統所能承擔的最高 I/O 速率可能有所下降。等系統中的所有節點都以新程式碼層次順利重新啟動之後,就會自動確定新層次。確定期間,可能會對效能產生短暫的影響。

在自動更新程式碼期間,會循序更新工作配對的每一個節點。正在更新的節點會暫時無法使用,且對該節點的所有 I/O 作業都會失敗。因此,I/O 錯誤計數會增加,且會將失敗的 I/O 作業導引至工作配對中的夥伴節點。應用程式不會看到任何的 I/O 失敗。將新節點新增到系統時,更新套件會自動從系統下載到新節點。

一般而言,更新作業可以與一般使用者 I/O 作業同時進行。不過,效能可能受影響。如果有任何限制適用於可在更新期間執行的作業,則會在您用來下載更新套件的產品網站上記載這些限制。在更新程序期間,大部分的配置指令都無法使用。從更新程序啟動到確定新程式碼層次,或是直到取消該程序為止,只有下列指令可運作:

  • 所有資訊指令
  • rmnode 指令

為了判定更新程序完成的時間,系統會透過管理 GUI 來通知您。如果您使用指令行介面,請發出 lsupdate 指令來顯示更新的狀態。

由於更新程序期間會出現一些作業限制,因此程式碼更新由使用者完成。不過,如果更新時發生問題,請聯絡支援中心。請勿在沒有技術協助之下,嘗試疑難排解更新問題。如需相關資訊,請參閱如何取得資訊、協助和技術協助的相關主題。

新增更多記憶體至節點或更正 DIMM 故障

重要: 透過新增更多記憶體來升級節點之前,您必須先從系統配置中移除該節點。如果要這麼做,請完成下列程序。同樣地,如果在更新程序期間,遇到任何節點的記憶體 DIMM 故障,請立即停止。然後,遵循此程序來確保更新成功。
  1. 如果您將記憶體新增至節點,則必須從系統配置中移除該節點。如果要這麼做,可以使用管理 GUI 或 CLI。
    • 如果要使用管理 GUI,請用滑鼠右鍵按一下節點,然後選取移除
    • 如果要使用 CLI,請輸入下列指令,其中 node_id | node_name 識別節點。
      svctask rmnode node_id | node_name
    註: 如果您要更換故障的 DIMM,則不必從系統中移除節點。前往步驟 2
  2. 如果您要更正節點中的 DIMM 故障,請移除 DIMM,如 卸下記憶體模組 (DIMM) 所述。然後,繼續步驟 3
  3. 若要使用更多記憶體來升級節點或要更換故障節點上的 DIMM,請遵循 更換記憶體模組 (DIMM) 中說明的步驟。然後,繼續步驟 4
  4. 檢查系統中其餘節點的狀態和更新狀態:
    svcinfo lssoftwareupgradestatus
  5. 如果夥伴節點已啟動,且系統更新狀態是 updating,請在維修模式下更新節點,再將它新增回系統中:
    svctask addnode
    請參閱 addnode 指令資訊,以取得可能的旗標。更新繼續進行。
  6. 如果夥伴節點已啟動,且系統更新狀態是 stalled,請決定要完成更新(推進)還是取消(回復)。您的決定有一部分取決於發生故障時您所處的更新進展情況。 您可以透過維修更新策略或節點移除(rmnode 指令)來推進更新。
    • 推進(維修更新):若要手動完成更新,請使用維修模式更新程序來更新其餘的舊版節點。當所有節點都執行同一層次之後,就會確定更新。
    • 推進(rmnode 指令):僅當更新已完成 50% 或以上時,才使用 rmnode 指令程序。
    • 回復(取消更新)。若有一或多個節點離線,則需要 -force 參數。
       svctask applysoftware -abort -force
      重要: 使用 -force 參數,可能導致無法存取。請只有在(您離線節點的)夥伴節點還是原始程式碼層次時,才選擇這個選項。
      更新的節點會回復為原始軟體層次,一次回復一個節點。
  7. 驗證所有節點都已回復,並執行相同的韌體。
  8. 輸入下列指令:
    svcconfig backup
  9. 驗證系統的性能。

系統更新之後

位於系統的審核日誌內容在更新之前,會先傳送到配置節點上 /dumps/audit 目錄中的檔案。現在審核日誌中的內容,會包括成功更新系統之後,來自所執行之指令的內容。