在不中斷運行的情況下更換節點

下列程序說明如何在不中斷運行的情況下更換大部分節點。

開始之前

下列程序不會中斷運行,因為不需要變更 SAN 環境。替換用(新)的節點會使用與所要更換節點相同的全球節點名稱 (WWNN)。此程序的替代方案是將磁區移至新的 I/O 群組或將 SAN 重新分區,在中斷運行的情況下更換節點。但是,中斷運行的程序需要對主機執行額外的工作。

此作業假設符合下列條件:

  • 現有系統軟體必須是支援新節點的版本。如果是使用 SAN Volume Controller 2145-CG8 節點來更換某個節點,則系統軟體版本必須是 6.2.0 或更新版本。如果是使用 SAN Volume Controller 2145-CF8 節點來更換某個節點,則系統軟體版本必須是 5.1.0 或更新版本。如果是使用 SAN Volume Controller 2145-8A4 節點來更換某個節點,則系統軟體版本必須是 4.3.1 或更新版本。
    註: 對於包含快閃記憶體隨身碟的節點:如果要將現有快閃記憶體隨身碟移至新節點,則新節點必須包含必要的序列連接 SCSI (SAS) 配接卡才能支援快閃記憶體隨身碟
  • 系統中配置的所有節點都存在且處於線上狀態。
  • 系統事件日誌中的所有錯誤都已解決且標示為已修正。
  • 沒有狀態為欠佳或離線的磁區、受管理磁碟 (MDisk) 或外部儲存體系統。
  • 替換用的節點未開啟電源。
  • 替換用的節點未連接至 SAN。
  • 對於每個新的 SAN Volume Controller 2145-CG8 SAN Volume Controller 2145-CF8SAN Volume Controller 2145-8A4 節點,您各有一個 2145 UPS-1U 裝置(配件代碼 8115)。
  • 您已備份系統配置並儲存 svc.config.backup.xml 檔案。
  • 替換用的節點必須能夠以所要更換節點的光纖通道或乙太網路連線速度運作。
  • 如果要更換的節點包含快閃記憶體隨身碟,請將所有快閃記憶體隨身碟及 SAS 配接卡轉移至新節點(如果它支援這些磁碟機)。為了防止喪失資料的存取權,如果新節點不支援現有快閃記憶體隨身碟,請在更換節點之前從快閃記憶體隨身碟轉移資料。
重要:
  1. 如果不符合以上所列的任何條件,請勿繼續執行此作業,除非 IBM® 支援中心指示您這麼做。
  2. 執行此作業之前,請檢閱所有後續步驟。
  3. 如果您不熟悉 SAN Volume Controller 環境或此作業中所述的程序,請勿執行此作業。
  4. 如果您計劃重複使用所更換的節點,請確保節點的 WWNN 是設定為 SAN 上的唯一編號。如果不能確保 WWNN 的唯一性,WWNN 和 WWPN 在 SAN 環境中會重複,而造成問題。
    提示: 您可以將所要更換節點的 WWNN 變更為替換用節點的原廠預設 WWNN,以確保此號碼是唯一的。
  5. 在此作業中,節點 ID 會發生變更,節點名稱也可能變更。當系統指派節點 ID 之後,就無法變更此 ID。不過,在此作業完成之後,您可以變更節點名稱。

關於這項作業

執行下列步驟以更換系統中的作用中節點:

程序

  1. (如果系統軟體版本是 5.1 或更新版本,請完成此步驟)。

    請確認沒有主機相依於節點。

    當您要關閉屬於系統一部分的節點時,或是要將節點從系統刪除時,可以使用管理 GUI 或指令行介面 (CLI) 指令。如果要在關閉節點之前驗證相依磁區,請完成下列步驟:
    1. 在管理 GUI 中,選取監視 > 系統
    2. 系統 -- 概觀頁面上,使用節點機匣所在機箱附近的方向箭頭來開啟機箱詳細資料頁面。
    3. 在系統的背面圖下,用滑鼠右鍵按一下機匣並從動作功能表中選取相依磁區,您可以顯示節點電源在關閉後主機無法使用的所有磁區。
    您也可以使用 node 參數及 lsdependentvdisks CLI 指令來檢視相依磁區。

    若有相依磁區存在,請判斷是否正在使用這些磁區。 如果正在使用這些磁區,請還原備用配置或暫停主機應用程式。 如果報告了相依仲裁磁碟,請修復仲裁磁碟的存取權,或是修改仲裁磁碟的配置。

  2. 使用下列步驟來確定系統配置節點,以及所要更換節點的 ID、名稱、I/O 群組 ID 及 I/O 群組名稱。如果您已知道所要更換節點的實體位置,則可跳過此步驟並繼續執行步驟 3
    提示: 如果要更換的其中一個節點是系統配置節點,請最後更換它。
    1. 從指令行介面 (CLI) 發出此指令:
      lsnode -delim : 

      此輸出是顯示的此指令輸出之範例:

      id:name:UPS_serial_number:WWNN:status:IO_group_id:IO_group_name:
      config_node:UPS_unique_id:hardware:iscsi_name:iscsi_alias
      3:dvt113294:100089J137:5005076801005A07:online:0:io_grp0:yes:
      20400002096810C7:8A4:iqn.1986-03.com.ibm:2145.ldcluster-80.dvt113294:
      14:des113004:10006BR010:5005076801004F0F:online:0:io_grp0:no:
      2040000192880040:8G4:iqn.1986-03.com.ibm:2145.ldcluster-80.des113004:
      
    2. config_node 直欄中,找到 yes 值,然後將這些值記錄在 idname 直欄中。
    3. 針對系統中的每一個節點,將這些值記錄在 idname 直欄中。
    4. 針對系統中的每一個節點,將這些值記錄在 IO_group_idIO_group_name 直欄中。
    5. 針對系統中的每個節點,從 CLI 發出此指令以確定面板 ID:
      lsnodevpd node_name or node_id

      其中,node_name or node_id 是您要確定其面板 ID 的節點名稱或 ID。

    6. 將該值記錄在 front_panel_id 直欄中。面板 ID 顯示在每個節點的前面。您可以使用此 ID 來確定符合您要更換的節點 ID 或節點名稱的節點的實體位置。
  3. 執行下列步驟以記錄所要更換節點的 WWNN 或 iSCSI 名稱
    1. 從 CLI 發出此指令:
      lsnode -delim : node_name or node_id
      

      其中,node_name or node_id 是您要確定其 WWNN 或 iSCSI 名稱的節點名稱或 ID。

    2. 記錄所要更換節點的 WWNN 或 iSCSI 名稱。此外,請記錄光纖通道埠及乙太網路埠的順序。
  4. 從 CLI 發出此指令以關閉節點電源:
    stopsystem -node node_name
    
    重要:
    1. 從節點背面拔除纜線之前,請使用節點埠號(光纖通道的埠 1 - 4,或乙太網路的埠 1 - 2)來記錄並標示光纖通道或乙太網路纜線的順序。節點背面上的光纖通道埠從左到右編號為 1 - 4。您必須在更換節點上以精確順序重新連接纜線,以避免此更換節點新增至系統時發生問題。如果未以相同順序連接纜線,埠 ID 可能變更,而影響主機存取磁區的能力。請參閱您的型號專用的硬體文件,以確定埠是如何編號的。
    2. 請勿將替換用的節點連接至交換器或引導器上的不同埠。 SAN Volume Controller 可以具有 4 Gbps 或 8 Gbps HBA。但是,請勿在此時將其移至更快的交換器或引導器埠,以避免在將替換用的節點新增至系統時發生問題。此作業是分開的,必須獨立於「更換系統中的節點」進行規劃。
  5. 發出此 CLI 指令,以從系統及 I/O 群組中刪除此節點:
    rmnode node_name or node_id

    其中,node_name or node_id 是您要刪除的節點名稱或 ID。您可以使用 CLI 來驗證刪除程序是否已完成。

  6. 發出此 CLI 指令,以確定節點不再是系統的成員:
    lsnode 
    將顯示節點清單。請等到已移除的節點未列在指令輸出中為止。
  7. 執行下列步驟以將您剛才從系統中所刪除節點的 WWNN 或 iSCSI 名稱變更為 FFFFF:
    對於 SAN Volume Controller 6.1.0 版或更新版本:
    1. 開啟節點電源。在顯示「叢集」畫面時,按下向上或向下按鈕,直到顯示動作選項。
    2. 按下後再鬆開選取按鈕。
    3. 按下向上或向下按鈕,直到顯示變更 WWNN?
    4. 按下再鬆開選取按鈕以顯示現行 WWNN。
    5. 按下再鬆開選取按鈕以切換至編輯模式。這時會顯示編輯 WWNN?畫面。
    6. WWNN 變更為 FFFFF
    7. 按下再鬆開選取按鈕以結束編輯模式。
    8. 按下向右按鈕以確認選擇。這時會顯示確認 WWNN?畫面。
    9. 按下再鬆開選取按鈕以確認。
  8. 在機架中安裝替換用的節點及不斷電系統,並連接不斷電系統纜線。請參閱《IBM SAN Volume Controller 2145-XXX 機型硬體安裝手冊 》以判斷如何連接節點及不斷電系統
    重要: 請勿在此步驟中連接光纖通道或乙太網路纜線。
  9. 如果要從舊節點中卸下快閃記憶體隨身碟並將其插入新節點,請參閱《IBM SAN Volume Controller 硬體維護手冊》以取得特定的指示。
  10. 開啟替換用的節點電源。
  11. 記錄此更換節點的 WWNN。如果您計劃重複使用正在更換的節點,則可使用此名稱。
  12. 執行下列步驟來變更替換用節點的 WWNN 名稱,以符合您在步驟 3 中記錄的名稱:

    對於 SAN Volume Controller 6.1.0 版或更新版本:

    1. 在顯示「叢集」畫面時,按下向上或向下按鈕,直到顯示動作選項。
    2. 按下後再鬆開選取按鈕。
    3. 按下向上或向下按鈕,直到顯示變更 WWNN?
    4. 按下再鬆開選取按鈕以顯示現行 WWNN。
    5. 按下選取按鈕以切換至編輯模式。這時會顯示編輯 WWNN?畫面。
    6. 將 WWNN 變更為您在步驟 3 中記錄的號碼。
    7. 按下再鬆開選取按鈕以結束編輯模式。
    8. 按下向右按鈕以確認選擇。這時會顯示確認 WWNN?畫面。
    9. 按下選取按鈕以確認。

    等待一分鐘。如果面板顯示叢集:,節點已備妥可新增至系統。如果沒有顯示叢集:,請參閱疑難排解資訊來判斷如何解決此問題,或是聯絡 IBM 支援中心,然後再繼續執行下一步。

  13. 將光纖通道或乙太網路纜線連接到您在步驟4中為原始節點記錄的相同埠號。
  14. 發出此 CLI 指令,以驗證 WWNN 的最後五個字元是否正確:
    lsnodecandidate
    重要: 如果 WWNN 與您在3步驟中記錄的不同,則您必須重複步驟12
  15. 發出此 CLI 指令以將節點新增至系統,並確保節點具有與原始節點相同的名稱,且在與原始節點相同的 I/O 群組中。如需相關資訊,請參閱 addnode CLI 指令文件。
    addnode -wwnodename WWNN -iogrp iogroupname/id 

    WWNNiogroupname/id 是您為原始節點記錄的值。

    SAN Volume Controller 5.1 版以及更新版本,會自動以原始使用的名稱重新指派該節點。 對於 5.1 版之前的版本,請將 name 參數與 svctask addnode 指令搭配使用來指派名稱。如果節點名稱的原始名稱是由 SAN Volume Controller 自動指派,則無法重複使用相同的名稱。如果其名稱以 node 開頭,則為自動指派。在此情況下,請指定不以 node 開頭的其他名稱,或不使用 name 參數,以便 SAN Volume Controller 能夠自動為節點指派新名稱。

    必要的話,新節點會更新成與系統相同的 SAN Volume Controller 軟體版本。此更新可能需要長達 20 分鐘的時間。

    重要:
    1. I/O 群組中的兩個節點都會快取資料;但其快取大小並非對稱。此更換節點受到 I/O 群組中夥伴節點的快取大小的限制。因此,此更換節點可能不會使用全部的快取大小,直到您更換 I/O 群組中的另一個節點。
    2. 您不需要重新配置主機多重路徑裝置驅動程式,因為替換用的節點會使用與前一個節點相同的 WWNN 及 WWPN。多重路徑裝置驅動程式應該會偵測可用於替換用節點的路徑回復狀況。
    3. 主機多重路徑裝置驅動程式需要大約 30 分鐘的時間來回復路徑。順利已更新 I/O 群組中的第一個節點之後,至少 30 分鐘內不要更新 I/O 群組中的其他節點。如果不同的 I/O 群組中有其他節點需要更新,您可以在等待時執行這些更新
  16. 在繼續執行下一步之前,請查詢路徑以確定所有路徑皆已回復。如果您使用 IBM 多重路徑子系統裝置驅動程式 (SDD) ,則查詢路徑的指令為 datapath query device。多重路徑裝置驅動程式隨附的文件顯示如何查詢路徑。
  17. 修復故障節點。

    如果您要使用已修復的節點作為備用節點,請執行下列步驟。

    對於 SAN Volume Controller 6.1.0 版或更新版本:
    1. 在顯示「叢集」畫面時,按下向上或向下按鈕,直到顯示動作選項。
    2. 按下後再鬆開選取按鈕。
    3. 按下向上或向下按鈕,直到顯示變更 WWNN?
    4. 按下再鬆開選取按鈕以顯示現行 WWNN。
    5. 按下再鬆開選取按鈕以切換至編輯模式。這時會顯示編輯 WWNN?畫面。
    6. WWNN 變更為 00000
    7. 按下再鬆開選取按鈕以結束編輯模式。
    8. 按下向右按鈕以確認選擇。這時會顯示確認 WWNN?畫面。
    9. 按下再鬆開選取按鈕以確認。

    現在,此節點可以作為備用節點。

  18. 請針對您要更換的每個節點重複執行 317 的步驟。