還原系統配置

本程序用於在下列狀況下回復系統配置:僅當回復系統程序失敗,或者當不需要磁區上所儲存的資料時。此程序也稱為「第 4 層級 (T4)」回復。

開始之前

這個配置還原程序主要用於還原配置的相關資訊,例如磁區、本端 Metro Mirror 資訊、本端 Global Mirror 資訊、儲存區及節點。不會還原已寫入磁區的資料。如果要還原磁區上的資料,您必須另外從任何以叢集系統上的磁區作為儲存體的應用程式中,還原應用程式資料。因此,在您遵循配置回復程序之前,必須具有此資料的備份。

如果在備份系統配置時對系統啟用了 USB 加密,則 節點 USB 埠中至少需要插入 3 個 USB 快閃記憶體隨身碟才能還原配置。在執行配置還原指令的單一節點中,必須插入 3 個 USB 快閃記憶體隨身碟。其他節點(可能屬於該系統)中的任何 USB 閃存驅動程式都將忽略。如果不是回復雲端備份配置,USB 快閃記憶體隨身碟中不需要包含任何金鑰。USB 快閃記憶體隨身碟中不需要包含任何金鑰。它們是為了在還原過程中產生新的金鑰。如果要回復雲端備份配置,USB 快閃記憶體隨身碟必須包含前一組金鑰,才能將目前加密的資料解除鎖定,並以新的金鑰重新加密。

在 T4 回復期間會以新的憑證建立新系統。如果系統具有金鑰伺服器加密,您必須使用 chsystemcert -export 指令來匯出新憑證,然後安裝在所有金鑰伺服器的正確裝置群組中,才能執行 T4 回復。使用的裝置群組是定義先前系統的裝置群組。可能還需要簽署新系統的憑證。在 T4 回復過程中,讓金鑰伺服器管理者知道現行金鑰不安全。

如果在備份系統配置時在該系統上啟用了使用 Gemalto SafeNet KeySecure 加密金鑰伺服器,並且設定了使用者名稱和密碼,則在執行配置還原指令之前,需要配置該使用者名稱和密碼。

重要: 執行 T4 程序之前,請聯絡 IBM® 支援中心以取得協助。

關於這項作業

您必須定期備份配置資料和應用程式資料,以避免資料流失。如果系統在發生嚴重故障之後停止運作,系統配置和應用程式資料都會遺失。您必須將系統還原到故障之前的確切狀態,然後回復應用程式資料。

在還原過程中,節點和儲存體機箱會還原到系統,然後會重新建立並配置 MDisk 和陣列。如果涉及多個儲存體機箱,則會根據機箱 ID,在適當的機箱上還原陣列和 MDisk。

重要:
  • 還原過程有兩個階段:準備和執行。在這兩個階段之間不得變更光纖或系統。
  • 對於所含節點會連接至 iSCSI 所虛擬化之外部控制器的系統而言,您必須先還原您的資料,才能將所有節點新增至系統中。此外,在還原您的資料之前,必須先手動重新套用系統 cfgportip 設定和 iSCSI 儲存體埠。 請參閱步驟 11
  • 對於 VMware vSphere 虛擬磁區(有時稱為 VVOL)環境而言,在進行 T4 還原之後,部分 虛擬磁區 配置步驟已經完成;這時已建立 metadatavdisk,已建立 user group 和使用者,已建立 adminlun 主機。 不過,使用者必須接著手動完成最後兩個配置步驟(在 IBM Spectrum® Connect 上建立一個儲存體,在 VMware vCenter 上建立虛擬機器)。請參閱配置 虛擬磁區
  • 如果系統具有 USB 加密,請從系統中任何已插入 USB 快閃記憶體隨身碟(包含加密金鑰)的節點執行回復。
  • 如果系統具有金鑰伺服器加密,請在連接至金鑰伺服器的節點上執行回復。將會從遠端的金鑰伺服器提取金鑰。
  • 如果系統使用 USB 和金鑰伺服器加密,請提供 USB 快閃記憶體隨身碟 或金鑰伺服器的連線(只需其中一項,但兩者也可運作)即可解除鎖定系統。
  • 具有雲端備份配置的系統在 T4 回復的期間,必須將含有來自原始系統之系統主要金鑰的 USB 金鑰插入新系統的配置節點。或者,如果使用金鑰伺服器,金鑰伺服器必須包含來自原始系統的系統主要金鑰。如果原始系統主要金鑰無法使用,而且在雲端提供者中的系統資料已加密,則無法存取雲端中的資料。
  • 如果系統包含的加密雲端帳戶同時配置為 USB 加密和金鑰伺服器加密,則在執行 T4 回復時,需要有這兩者提供的主要金鑰。
  • 如果您使用 USB 快閃記憶體隨身碟 來管理加密金鑰,若 USB 快閃記憶體隨身碟 未插入系統,T4 回復會導致與雲端服務供應商的連線離線。要修正這個問題,請將含有現行金鑰的 USB 快閃記憶體隨身碟 插入系統。
  • 如果您使用金鑰伺服器來管理加密金鑰,若金鑰伺服器離線,T4 回復會導致與雲端服務提供者的連線離線。如果要修正此問題,在 T4 回復的期間,請確定金鑰伺服器為線上且可用。
  • 如果您使用金鑰伺服器和 USB 快閃記憶體隨身碟 來管理加密金鑰,若金鑰伺服器離線,T4 回復會導致與雲端服務供應商的連線離線。要修正這個問題,在 T4 回復的期間,請確定金鑰伺服器為線上且 USB 快閃記憶體隨身碟 已插入系統。
  • 如果系統包含使用 USB 加密的加密雲端帳戶,則配置節點中必須存在具有系統主要金鑰的 USB 快閃記憶體隨身碟,雲端帳戶才能變成線上狀態。在系統關閉電源又重新啟動時,這是必要的需求。
  • 在 T4 回復之後,雲端帳戶會處於離線狀態。需要重新輸入鑑別資訊才能讓帳戶回到線上。
  • T4 回復之後,在回復之前已啟用雲端 Snapshot 的磁區,必須手動重新啟用雲端 Snapshot。
  • 具有不一致所有權群組的 FlashCopy® 對映和主機對映不會加以還原。

如果不瞭解 CLI 指令的執行指示,請參閱指令行介面參照資訊。

如果要還原配置資料,請遵循下列步驟:

程序

  1. 在執行此回復程序前,驗證是否所有節點都可作為候選節點。必須移除錯誤 550 或 578,才能讓節點變成候選狀態。
  2. 建立系統。可能的話,請使用原先位於 I/O 群組 0 中的節點。
  3. 在支援的瀏覽器中,輸入您用於起始設定系統的 IP 位址及預設超級使用者密碼 (passw0rd)。
  4. 這時會顯示設定精靈。請注意下列項目:
    1. 接受授權合約。
    2. 設定系統名稱、日期和時間設定及系統授權的值。在配置還原過程中會還原原始設定。
    3. 驗證硬體。只會顯示已建立叢集系統的控制機箱及直接連接的擴充機箱。其他 I/O 群組中的所有其他控制機箱和延伸機箱稍後都會新增到系統中。

    設定精靈完成後,請勿再進行任何其他配置變更。

  5. 如果已在設定精靈中設定電子郵件通知,現在必須移除該電子郵件使用者和伺服器,才能還原原始配置。
    發出下列 CLI 指令以移除新的電子郵件使用者:
    rmemailuser 0
    發出下列 CLI 指令以移除新的電子郵件伺服器:
    rmemailserver 0
  6. 發出下列 CLI 指令以確保只有配置節點在線上:
    svcinfo lsnode

    下列輸出是所顯示內容的範例。

    id name status IO_group_id IO_group_name config_node
    1 nodel online 0 io_grp0 yes
  7. 識別您要還原的配置備份檔。

    該檔案可以是您備份配置時所儲存之配置備份 XML 檔案的本端副本,也可以是其中一個節點上的最新檔案。

    配置節點會在每天系統時間 01:00 自動備份配置資料。

    下載並檢查先前系統中所有節點上的配置備份檔,確定包含最新完整備份的檔案。

    1. 管理 GUI,按一下設定 > 支援 > 支援套件
    2. 展開手動上傳指示,然後選取下載支援套件
    3. 下載新的支援套件或日誌檔頁面上,選取下載現有的套件
    4. 對於系統中的每個節點(機匣),請完成下列步驟:
      1. 從表格頂端的選取框中,選取要處理的節點。
      2. 尋找名稱符合 svc.config.*.xml* 型樣的所有檔案。
      3. 選取檔案,然後按下載以下載到電腦。
    XML 檔案包含日期和時間,可用來識別最新備份。在識別要於還原系統的備份 XML 檔案後,請將檔案重新命名為 svc.config.backup.xml
  8. 將您要據以還原的 XML 備份檔複製到系統。
    pscp full_path_to_identified_svc.config.file 
    superuser@cluster_ip:/tmp/svc.config.backup.xml
  9. 如果系統中有任何節點已安裝 10 GB 介面配接卡或第二個光纖通道介面配接卡,而且先前已配置非預設 localfcportmaskpartnerfcportmask 設定,請在還原資料之前手動重新配置這些設定。
  10. 如果系統採用延伸拓蹼或 HyperSwap® 拓蹼,且節點分散在兩個站台,或者,如果系統中有任何節點具有快閃記憶體隨身碟(包括連接至擴充機箱的節點),則現在必須將這些節點新增至系統。
    如果要新增這些節點,請從配置備份檔中決定任何這種節點的畫面名稱、節點名稱和 I/O 群組。如果要將這些節點新增至系統,請執行下列指令:
    svctask addnode -panelname panel_name -iogrp iogrp_name_or_id -name node_name
    其中,panel_name 是畫面上顯示的名稱,iogrp_name_or_id 是要其中新增此節點之 I/O 群組的名稱或 ID,node_name 是節點的名稱。
  11. 如果系統包含任何 iSCSI 儲存體控制器,現在必須手動偵測這些控制器。在還原資料之前,必須先將連接至這些控制器的節點、iSCSI 埠 IP 位址及 iSCSI 儲存體埠新增至系統。
    註: 如果系統只包含「光纖通道」儲存體控制器,請繼續下一步。
    註: 對於延伸拓蹼或 HyperSwap 拓蹼 ,在執行 addnode 指令後,變更系統中新增的所有節點的網站。例如,
    chnode -site site_id node_id/node_name
    1. 如果要新增這些節點,請從配置備份檔中決定任何這種節點的畫面名稱、節點名稱和 I/O 群組。如果要將這些節點新增至系統,請執行下列指令:
      svctask addnode -panelname panel_name -iogrp iogrp_name_or_id -name node_name

      其中,panel_name 是畫面上顯示的名稱,iogrp_name_or_id 是要其中新增此節點之 I/O 群組的名稱或 ID,node_name 是節點的名稱。

    2. 如果要還原 iSCSI 埠 IP 位址,請使用 cfgportip 指令。
      1. 如果要還原 IPv4 位址,請從配置備份檔中決定 id (port_id)、node_id、node_name、IP_address、mask、gateway、host(0/1 表示 no/yes)、remote_copy(0/1 表示 no/yes)及 storage(0/1 表示 no/yes),然後執行下列指令:
        svctask cfgportip -node node_name_or_id -ip ipv4_address -masksubnet_mask-gw ipv4_gw 
        -host yes | no -remotecopy remote_copy_port_group_id -storage yes | no -hpgid
        host_port_grp_id port_id

        其中,node_name_or_id 是節點的名稱或 ID,ipv4_address 是埠的 IPv4 版本通訊協定位址,ipv4_gw 是埠的 IPv4 閘道位址。

      2. 如果要還原 IPv6 位址,請從配置備份檔中決定 id (port_id)、node_id、node_name、IP_address_6、mask、gateway_6、prefix_6、host_6(0/1 表示 no/yes)、remote_copy_6(0/1 表示 no/yes)及 storage_6(0/1 表示 no/yes),然後執行下列指令:
        svctask cfgportip -node node_name_or_id -ip_6 ipv6_address -gw_6 ipv6_gw 
        -prefix_6 prefix -host_6 yes | no -remotecopy_6 remote_copy_port_group_id -storage_6 yes | no
        -hpgid host_port_grp_id port_id

        其中,node_name_or_id 是節點的名稱或 ID,ipv6_address 是埠的 IPv6 版本通訊協定位址,ipv6_gw 是埠的 IPv6 閘道位址,prefix 是 IPv6 字首。

        註: 參數 -hpgid 專門用於手動 T4 回復。請不要在其他場景下使用此參數。

      針對備份配置檔的 node_ethernet_portip_ip 區段中的所有(先前已配置的)IP 埠,完成步驟 b.i 和 b.ii。

    3. 接下來,使用 detectiscsistorageportcandidateaddiscsistorageport 指令,以偵測並新增 iSCSI 儲存體埠候選項。請確保偵測到 iSCSI 儲存體埠,並按照在配置備份檔中看到的順序新增這些埠。如果不按照正確的順序,可能會導致 T4 失敗。完成步驟 c.i 之後必須接著執行步驟 c.ii 和 c.iii。對於備份配置檔中列出的所有 iSCSI 階段作業,必須按照完全相同的順序重複這些步驟。
      1. 如果要偵測 iSCSI 儲存體埠,請從配置備份檔中決定 src_port_idIO_group_id(選用,值為 255 時不需要)、target_ipv4/target_ipv6(需要非空白的目標 IP)、iscsi_user_name(空白時不需要)、iscsi_chap_secret (空白時不需要)及 site(空白時不需要),然後執行下列指令:
        svctask detectiscsistorageportcandidate -srcportid src_port_id -iogrp IO_group_id 
        -targetip/targetip6 target_ipv4/target_ipv6 -username iscsi_user_name -chapsecret iscsi_chap_secret -site site_id_or_name

        其中,src_port_id 是配置埠的來源乙太網路埠 ID,IO_group_id 是要偵測的 I/O 群組 ID 或名稱,target_ipv4/target_ipv6 是 IPv4/IPv6 目標 iSCSI 控制器 IPv4/IPv6 位址,iscsi_user_name 是要偵測的目標控制器使用者名稱,iscsi_chap_secret 是要偵測的目標控制器 CHAP 密碼,site_id_or_name 是要偵測之站台的指定 ID 或名稱。

      2. 執行 lsiscsistorageportcandidate 指令,以比對探索到的 target_iscsiname 與備份配置檔中用於此特定階段作業的 target_iscsiname,然後利用相符的索引,在步驟 c.iii 中新增 iSCSI 儲存體埠。

        執行 svcinfo lsiscsistorageportcandidate 指令,在 target_iscsiname 與配置備份檔中的 target_iscsiname 相符的那一列,決定 id 欄位。這是要在步驟 c.iii 中使用的 candidate_id

      3. 如果要新增 iSCSI 儲存體埠,請從配置備份檔中決定 IO_group_id(選用,值為 255 時不需要)、site(空白時不需要)、iscsi_user_name(在備份檔中空白時不需要)及 iscsi_chap_secret(空白時不需要),提供步驟 c.ii 中符合的 target_iscsiname_index,然後執行下列指令:
        addiscsistorageport -iogrp iogrp_id -username iscsi_user_name -chapsecret iscsi_chap_secret -site site_id_or_name candidate_id

        其中,iogrp_id 是要新增的 I/O 群組 ID 或名稱,iscsi_user_name 是要新增的目標控制器使用者名稱,iscsi_chap_secret 是要新增的目標控制器 CHAP 密碼,site_id_or_name 指定要新增之站台的 ID 或名稱。

      4. 如果配置是 HyperSwap 或延伸系統,則需要還原控制器名稱和網站。如果要還原控制器名稱和站台,請從備份 xml 檔案中比對 inter_WWPN 欄位與新增的 iSCSI 控制器,以決定 controller_name 和控制器 site_id/name,然後執行下列指令:
        chcontroller -name controller_name -site site_id/name controller_id/name

        其中,controller_name 是備份 XML 檔案中的控制器名稱,site_id/name 是備份 XML 檔案中 iSCSI 控制器的站台 ID 或名稱,controller_id/name 是控制器的 ID 或現行名稱。

  12. 如果系統使用「輕量型目錄存取通訊協定 (LDAP)」作為遠端鑑別服務且配置了管理者密碼,則必須手動還原密碼,然後再還原資料。下列範例顯示了用來配置 LDAP 管理者使用者名稱和密碼的指令:
    svctask chldap -username ldap_username -password 'administrator_password'
  13. 發出下列 CLI 指令,以比較現行配置與備份配置資料檔:
    svcconfig restore -prepare
    這個 CLI 指令會在配置節點的 /tmp 目錄中建立日誌檔。日誌檔的名稱為 svc.config.restore.prepare.log
    註: 探索每一個 256-MDisk 批次需要將近一分鐘的時間。輸入這個指令之後,如果 MDisk 出現 CMMVC6200W 錯誤訊息,表示可能尚未探索到所有受管理磁碟 (MDisk)。請稍待片刻再重試 svcconfig restore -prepare 指令。
  14. 如果系統具有金鑰伺服器加密,您必須使用 chsystemcert -export 指令來匯出新憑證,然後安裝在所有金鑰伺服器的正確裝置群組中,才能執行 T4 回復。使用的裝置群組是定義先前系統的裝置群組。可能還需要簽署新系統的憑證。
  15. 發出下列指令,將日誌檔複製到系統可存取的其他伺服器:
    pscp superuser@cluster_ip:/tmp/svc.config.restore.prepare.log 
    full_path_for_where_to_copy_log_files
  16. 從目前儲存副本的伺服器中開啟該日誌檔。
  17. 檢查日誌檔中是否有錯誤。
    • 如果發現錯誤,請更正導致錯誤的情況,然後重新發出指令。必須更正所有錯誤,才能繼續步驟 18
    • 如果需要協助,請聯絡支援中心。
  18. 發出下列 CLI 指令以還原配置:
    svcconfig restore -execute
    註: 還原過程中會自動新增您未手動新增至系統的任何節點。

    這個 CLI 指令會在配置節點的 /tmp 目錄中建立日誌檔。日誌檔的名稱為 svc.config.restore.execute.log

  19. 發出下列指令,將日誌檔複製到系統可存取的其他伺服器:
    pscp superuser@cluster_ip:/tmp/svc.config.restore.execute.log 
    full_path_for_where_to_copy_log_files
  20. 從目前儲存副本的伺服器中開啟該日誌檔。
  21. 檢查日誌檔,確保沒有出現任何錯誤或警告。
    註: 您可能會收到警告,指出授權特性未啟用。此訊息表示在回復程序之後,現行授權設定與先前授權設定不符。回復程序會繼續正常執行,您稍後可以在管理 GUI 中輸入正確的授權設定。

    再次透過 SSH 登入 CLI 時,您會看到下列輸出:

    IBM_2145:your_cluster_name:superuser>

下一步

您可以發出下列 CLI 指令,從配置上的 /tmp 目錄中移除任何不想要的配置備份及還原檔案。
svcconfig clear -all