MAP 5350:關閉節點電源

MAP 5350:關閉節點電源可協助您關閉單一節點電源來完成維修動作,而不會中斷主機對磁區的存取。

開始之前

如果已正確設定解決方案,關閉單一節點電源不會中斷系統的正常作業。系統具有成對的節點,稱為 I/O 群組。I/O 群組在僅有單一節點開啟電源的情況下繼續處理其管理的磁碟的 I/O。不過,效能會降低並減少錯誤的恢復能力。

關閉系統節點電源時,請注意,避免對系統造成不必要的影響。
註: 如果您未遵循此處所述的程序,應用程式主機可能會無法存取資料,最壞情況下可能會遺失資料。
您可以使用下列偏好的方法關閉屬於系統成員且未離線的節點的電源:
  1. 使用管理 GUI 或服務助理介面中的關閉電源選項。
  2. 使用 CLI 指令 stopsystem –node name

建議使用管理 GUI 或指令行介面 (CLI) 來關閉節點電源。這些方法提供到夥伴節點的控制切換,並向系統中的其他故障提供更好的恢復能力。

只有當節點離線或不是系統成員時,才必須使用電源按鈕關閉其電源。

關於這項作業

如果要在關閉節點電源時儘量減少中斷情況,必須符合下列所有條件。
  • I/O 群組中的另一個節點的電源已開啟,且在系統中處於作用中狀態。
  • I/O 群組中的另一個節點具有所有主機及磁碟控制器的 SAN 光纖通道連線,這些連線由 I/O 群組管理。
  • 此 I/O 群組處理的所有磁區都處於線上狀態。
  • I/O 群組中另一個節點的主機多重路徑處於線上狀態。

在某些情況下,您關閉節點的原因可能無法滿足這些條件。例如,如果更換發生故障的光纖通道配接卡,則磁區不顯示連線狀態。請自行判斷決定在未滿足條件時繼續作業是否安全。在繼續執行可能中斷 I/O 存取的關閉電源作業之前,請一律洽詢系統管理者。系統管理者可能偏好等待更合適的時間或暫停主機應用程式。

為確保順利重新啟動,節點必須將其無法重新建立的資料結構儲存至本端內部磁碟機。節點儲存至本端磁碟的資料量可能很高,因此此作業可能需要數分鐘。不要嘗試中斷受控電源關閉。

小心: 下列動作不容許節點將資料儲存至其本端磁碟。因此,請勿使用下列方法關閉節點電源:
  • 按住節點(除非是 SAN Volume Controller 2145-SV1 )上的電源按鈕。

    按下再鬆開電源按鈕時,節點會向軟體指示此作業,因此節點可以在節點電源關閉之前將其資料寫入至本端磁碟。

    按住電源按鈕時,硬體將此動作解譯為緊急電源關閉指示並立即關閉。硬體在關閉電源之前不會將資料儲存至本端磁碟。在按住電源按鈕之後大約 4 秒鐘,會發生緊急電源關閉。

  • 按下光徑診斷面板上的重設按鈕。
重要: 關閉 SAN Volume Controller 2145-DH8 節點的電源,可能要等到第二天才耗盡電池電量。請遵循下列步驟,以防止在節點連接至電源但未開啟電源時電池過度放電:
  1. 將兩個電池拉出節點。將其一直放在外面,直至您準備好開啟節點電源。
  2. 先向內推電池,然後按下電源按鈕以開啟節點電源。
如果從 SAN Volume Controller 2145-DH8 節點中斷電源連接,並且在接下來 24 小時內可能不會再次將電源與其重新連接,請遵循下列步驟,以防止在節點未連接至電源時電池過度放電:
  1. 從節點拔掉兩條電源線之後,從節點中拉出兩個電池。此步驟會完全關閉電池背板。
  2. 再次將電池推回。

使用管理 GUI 關閉系統電源。

使用管理 GUI 關閉系統電源。

程序

如果要使用管理 GUI 關閉系統電源,請完成下列步驟:

  1. 啟動您正在提供服務的系統的管理 GUI
  2. 選取監視 > 系統

    如果要關閉電源的節點顯示為離線,則表示節點未參與系統。在此類情況下,請使用離線節點上的電源按鈕關閉節點電源。

    如果要關閉電源的節點顯示為線上,關閉節點電源可能會導致相依磁區也會離線。

    1. 選取節點,然後按一下顯示相依磁區
    2. 確保 I/O 群組中的每一個磁區的狀態為線上。您可能需要檢視多個頁面。
      您可能需要檢視多個頁面。

      如果任何磁區都處於欠佳狀態,則表示 I/O 中僅有一個節點在處理該磁區的 I/O 要求。如果該節點已關閉電源,則它會影響正在將 I/O 要求提交至欠佳磁區的所有主機。

      如果任何磁區都欠佳,且您認為可能是因為 I/O 群組中的夥伴節點最近已關閉電源,請等待直至畫面重新整理,顯示所有磁區都處於線上狀態。所有磁區在夥伴節點關閉電源的 30 分鐘內都必須處於線上狀態。

      註: 等待 30 分鐘之後,如果磁區欠佳,且所有關聯節點及 MDisk 都處於線上狀態,請聯絡支援中心取得協助。

      請先確保主機使用的所有磁區都處於線上狀態,然後再繼續。

    3. 可能的話,請檢查所有存取此 I/O 群組管理的磁區的主機是否都可以失效接手,以使用該群組中另一個節點提供的路徑。

      使用主機系統的多路徑裝置驅動程式軟體完成此檢查。根據使用的多路徑裝置驅動程式,要使用的指令有所不同。

      如果您使用 System Storage® 多重路徑子系統裝置驅動程式 (SDD),查詢路徑的指令為 datapath query device

      在開啟節點電源之後,多路徑裝置驅動程式可能需要一些時間來重新探索路徑。如果您無法對主機檢查 I/O 群組中的兩個節點的所有路徑是否都可用,請勿在夥伴節點開啟電源 30 分鐘內關閉節點電源,否則,您可能無法存取磁區。

    4. 如果您決定可以繼續關閉節點電源,請選取要關閉電源的節點,然後按一下關閉系統
    5. 按一下確定。如果選取的節點是可讓您存取磁區的最後一個剩餘節點(例如,包含具有非鏡映磁區的快閃記憶體隨身碟的節點),則會顯示「強制關閉節點」面板,其中列出在關閉節點時將離線的磁區。
    6. 檢查沒有主機應用程式存取正在離線的磁區。只有在可接受無法存取這些磁區時,才繼續關閉。如果要繼續關閉節點,請按一下強制關閉

下一步

在關閉程序期間,節點將其資料結構儲存至本端磁碟,並將快取中保存的所有寫入資料退置到 SAN 磁碟。此類處理可能需要數分鐘。

在此處理結束時,系統電源會關閉。

使用系統 CLI 關閉節點電源

使用指令行介面 (CLI) 關閉節點電源。

程序

  1. 發出 lsnode CLI 指令以顯示系統中的節點及其內容的清單。尋找要關閉的節點並記下其 I/O 群組的名稱。確認 I/O 群組中的另一個節點處於線上狀態。
    lsnode -delim : 
    
    id:name:UPS_serial_number:WWNN:status:IO_group_id: IO_group_name:config_node:
    UPS_unique_id 
    1:group1node1:10L3ASH:500507680100002C:online:0:io_grp0:yes:202381001C0D18D8 
    2:group1node2:10L3ANF:5005076801000009:online:0:io_grp0:no:202381001C0D1796 
    3:group2node1:10L3ASH:5005076801000001:online:1:io_grp1:no:202381001C0D18D8 
    4:group2node2:10L3ANF:50050768010000F4:online:1:io_grp1:no:202381001C0D1796
    

    如果要關閉電源的節點顯示為離線,則表示節點未參與系統且未在處理 I/O 要求。在此類情況下,請使用節點上的電源按鈕關閉節點電源。

    如果關閉線上節點的電源,但該節點的夥伴節點不在線上,則向 I/O 群組所管理的磁區提交 I/O 要求的所有主機都受影響。確保 I/O 群組中的另一個節點處於線上狀態,然後再繼續。

  2. 發出 lsdependentvdisks -node <name> CLI 指令,以列出相依於指定節點狀態的磁區。
    lsdependentvdisks -node group1node1 
    
    vdisk_id       vdisk_name
    0              vdisk0
    1              vdisk1

    如果節點離線或從系統中移除,則相依磁區也會離線。在使節點離線或將其從系統中移除之前,您可以使用此指令來確保不會無法存取任何磁區。

  3. 如果您決定可以繼續關閉節點電源,請輸入 stopsystem –node <name> CLI 指令以關閉節點電源。使用 –node 參數避免關閉整個系統的電源:
    stopsystem –node group1node1
    Are you sure that you want to continue with the shut down? yes
    
    註: 如果要關閉含有相依磁區的節點,請將 -force 參數新增至 stopsystem 指令。force 參數會強制指令繼續執行,即使節點的任何相依磁區將離線。請謹慎使用 force 參數;這會遺失對節點相依磁區資料的存取權。

    在節點關閉期間,節點會將其資料結構儲存至其本端磁碟,並將快取中的所有寫入資料退置到 SAN 磁碟。關閉程序可能需要幾分鐘的時間。

    在此程序結束時,節點電源會關閉。

使用系統電源控制按鈕進行關閉

除非存在緊急情況或另一個程序指引您這麼做,否則請勿使用電源控制按鈕來關閉節點電源。

開始之前

使用此方法,您無法從面板檢查系統狀態,因此無法分辨關閉電源是否會對系統造成過多中斷。請改用前一主題中所述的管理 GUI 或 CLI 指令來關閉作用中節點的電源。

關於這項作業

如果您必須使用此方法,請注意圖 1圖 2,每一種機型的正面具有電源控制按鈕  1 

圖 1. SAN Volume Controller 2145-CF8 2145-CG8 2145-DH8 型號上的電源控制按鈕以及 SAN Volume Controller 2145-DH8 型號上的電源控制按鈕

        2145-DH8 型號上的電源控制按鈕
圖 2. SAN Volume Controller 2145-SV1 型號上的電源控制按鈕和 LED 燈

SAN Volume Controller 2145-SV1
 型號上的電源控制按鈕
  •  1  電源控制按鈕和電源開啟 LED
  •  2  識別 LED
  •  3  節點狀態 LED
  •  4  節點故障 LED
  •  5  電池狀態 LED

在您確定可安全地執行此作業時,按下再立即鬆開電源按鈕。 2145-DH8 2145-SV1 之外的其他型號上,面板顯示器會變成顯示關閉電源中並顯示進度列。

註: 2145-DH8 2145-SV1 沒有面板顯示器,但圖 2 中的狀態 LED  2  3  4  5 都會熄滅,且電源開啟 LED  1  會從亮起變成閃爍。

結果

節點在關閉電源的同時將其資料結構儲存至磁碟。關閉電源程序可能需要長達 5 分鐘。

在使用電源按鈕(或由於電源故障)關閉節點電源時,其 I/O 群組中的夥伴節點會立即停止使用快取新增寫入資料,並將快取中已有的任何寫入資料退置到 SAN 連接的磁碟。

退置期間取決於磁碟控制器的速度及使用率。完成時間少於 15 分鐘,但是可能需要更長時間。如果有資料在等待寫入至離線的磁碟,則退置無法完成。

在夥伴節點繼續處理 I/O 時關閉電源並重新啟動的節點可能無法立即成為 I/O 群組的作用中成員。節點必須等到夥伴節點完成退置快取。

如果夥伴節點在此期間關閉電源,則無法存取此 I/O 群組管理的 SAN 儲存體。如果 I/O 群組中的其中一個節點無法為任何 I/O 提供服務,則該 I/O 群組管理的磁區的狀態為欠佳。例如,如果 I/O 群組中的夥伴節點仍在清除寫入快取,其狀態為欠佳