MAP 5800:光通路

MAP 5800:光通路可帮助您解决那些阻止 SAN Volume Controller 2145-DH8 引导的硬件问题。

开始之前

如果您不熟悉这些维护分析过程 (MAP),请先阅读使用维护分析过程

您可能因以下情况而转至该处:

SAN Volume Controller 2145-DH8的光通路

光通路诊断是 SAN Volume Controller 2145-DH8节点的操作员信息面板顶部的指示灯系统,用于将您引至发生故障的组件。

关于此任务

发生错误时,操作员信息面板前部、光通路诊断面板和发生故障的组件上的指示灯会顺次点亮。通过按特定顺序查看指示灯,您通常可以确定错误来源。

如果节点连接到正常工作的电源,那么在关闭服务器后,为指示错误而点亮的指示灯仍会点亮。

确保节点处于开启状态,然后解决由错误指示灯和光通路指示灯指示的任何硬件错误:

过程

  1. SAN Volume Controller 2145-DH8操作员信息面板上的系统错误指示灯  7 (如图 1 中所示)是点亮还是闪烁?
    图 1. SAN Volume Controller 2145-DH8 操作员信息面板
    SAN Volume Controller 2145-DH8 操作员信息面板
    •  1  电源控制按钮和指示灯。
    •  2  以太网指示灯。
    •  3  定位器按钮和指示灯。
    •  4  松开滑锁。
    •  5  以太网活动指示灯。
    •  6  检查日志指示灯。
    •  7  系统错误指示灯。
    重新评估症状并返回到 MAP 5000:启动
    请转至步骤 2
  2. (紧接步骤 1
    按压松开滑锁(如图 2 中所示),然后打开光通路诊断面板(如图 3 中所示)。
    图 2. 按压松开滑锁
    按压松开滑锁
    光通路诊断面板上的一个或多个指示灯是点亮还是闪烁?
    图 3. SAN Volume Controller 2145-DH8 光通路诊断面板
    SAN Volume Controller 2145-DH8光通路诊断面板
    验证操作员信息面板电缆的两端是否正确连接。如果错误指示灯仍点亮,但是光通路诊断面板上的指示灯均未点亮,请按以下顺序更换部件:
    1. 操作员信息面板
    2. 主板
    继续使用 MAP 5700:修复验证来验证修复情况。
    请参阅表 1,并完成针对特定光通路诊断指示灯指定的操作。然后,转至步骤 3。 一些操作要求观察主板上指示灯的状态。图 4 显示了主板指示灯的位置。风扇指示灯位于每个风扇旁边。要查看这些指示灯,请完成以下操作:
    1. 在关闭节点之前,确保已制作其数据的镜像并进行了同步。
    2. 识别连接到节点的所有电缆并做好标签,以便将它们连接到正确的端口。 从机架上卸下节点,并将它放置在平坦的防静电平面。
    3. 卸下顶盖。
    4. 请参阅表 1,并完成针对特定光通路诊断指示灯指定的操作。然后,转至步骤 3
    图 4. SAN Volume Controller 2145-DH8 主板指示灯。
    SAN Volume Controller 2145-DH8 主板指示灯
    表 1. 诊断面板指示灯
    指示灯 描述 操作
    错误日志或检查日志指示灯

    操作员信息面板

    发生错误,如不完成特定过程将无法隔离该错误。
    1. 插入 VGA 屏幕和 USB 键盘。
    2. 检查 IMM2 系统事件日志和系统错误日志,以获取有关该错误的信息。
    3. 必要时保存日志并随后清空日志。
    系统错误指示灯

    操作员信息面板

    发生了错误。
    1. 检查光通路诊断指示灯并遵循指示信息。
    2. 检查 IMM2 系统事件日志和系统错误日志,以获取有关该错误的信息。
    3. 必要时保存日志并随后清空日志。
    PS 当只有 PS 指示灯点亮时,表示电源发生故障。 系统可能检测到电源错误。 请完成以下步骤来更正此问题:
    1. 检查黄色指示灯点亮的电源。
    2. 确保电源已正确安装并插入到正常工作的交流电源插座上。
    3. 卸下一个电源以隔离发生故障的电源。
    4. 确保服务器中安装的两个电源的交流输入电压相同。
    5. 更换发生故障的电源。
    PS + CONFIG

    当 PS 指示灯和 CONFIG 指示灯都点亮时,表示电源配置无效。

    如果 PS 指示灯和 CONFIG 指示灯均点亮,那么系统会记录“电源配置无效”错误。确保节点中安装的两个电源的额定值或功率相同。
    OVER SPEC 系统功耗达到电源的过流保护点,或者电源已损坏。
    1. 如果未检测到电源导轨(A、B、C、D、E、F、G 和 H)错误,请完成以下步骤:
      1. 使用 IBM Systems Energy Estimator 以确定当前系统功耗。有关更多信息,请转至以下 Web 站点:

        https://www-947.ibm.com/systems/support/tools/estimator/energy/index.html

      2. 更换发生故障的电源。
    2. 如果还检测到电源导轨(A、B、C、D、E、F、G 和 H)错误,请执行 MAP 5040:电源 SAN Volume Controller 2145-DH8中列出的操作。
    PCI PCI 总线或主板上发生了错误。在发生故障的 PCI 插槽旁边的另一指示灯已点亮。
    1. 检查转接卡指示灯、ServeRAID 错误指示灯和双端口网络适配器错误指示灯,以识别导致该错误的组件。
    2. 检查系统错误日志以获取有关该错误的信息。
    3. 如果使用指示灯和系统错误日志中的信息无法确定发生故障的组件,请逐个卸下组件。然后,在卸下每个组件后重新启动服务器。
    4. 按显示的顺序更换以下组件(每更换一个组件后都重新启动服务器):
      • PCI 转接卡
      • ServeRAID 适配器
      • 网络适配器
      • (仅限经过培训的技术人员)主板。
    5. 如果故障仍然存在,请与 IBM® 服务代表联系。
    NMI 发生了不可屏蔽中断,或者按了 NMI 按钮。
    1. 检查系统错误日志以获取有关该错误的信息。
    2. 重新启动服务器。
    CONFIG CONFIG + PS 发生了“电源配置无效”错误。 如果 CONFIG 指示灯和 PS 指示灯均点亮,那么系统会记录“电源配置无效”错误。确保服务器中安装的两个电源的额定值或功率相同。
    CONFIG + CPU 发生了硬件配置错误。 如果 CONFIG 指示灯和 CPU 指示灯均点亮,请完成以下步骤来更正该问题:
    1. 检查已安装的微处理器以确保其相互兼容。
    2. (仅限经过培训的技术人员)更换不兼容的微处理器。
    3. 检查系统错误日志以获取有关该错误的信息。更换错误日志中标出的任何组件。
    CONFIG + MEM 发生了硬件配置错误。 如果 CONFIG 指示灯和 MEM 指示灯均点亮,请检查 Setup Utility 中的系统事件日志或 IMM2 错误消息。
    CONFIG + PCI 发生了硬件配置错误。 如果 CONFIG 指示灯和 PCI 指示灯均点亮,请检查系统错误日志以获取有关该错误的信息。更换错误日志中标出的任何组件。
    CONFIG + HDD 发生了磁盘驱动器错误。 如果 CONFIG 指示灯和 HDD 指示灯均点亮,请检查系统错误日志以获取有关该错误的信息。更换错误日志中标出的任何组件。
    LINK 已保留。
    CPU 当仅有 CPU 指示灯点亮时,表示微处理器发生了故障。当 CPU 和 CONFIG 指示灯均点亮时,表示微处理器配置无效。
    1. 如果 CONFIG 指示灯未点亮,那么表示微处理器发生故障,请完成以下步骤:
      1. (仅限经过培训的技术人员)确保已正确安装发生故障的微处理器及其散热器,它们通过主板上点亮的指示灯来指示。
      2. (仅限经过培训的技术人员)更换发生故障的微处理器。
      3. 有关更多信息,请与 IBM 服务代表联系。
    2. 如果 CONFIG 指示灯和 CPU 指示灯均点亮,那么系统会记录“微处理器配置无效”错误。请完成以下步骤来更正此问题:
      1. 检查最近安装的微处理器以确保其相互兼容。
      2. (仅限经过培训的技术人员)更换任何不兼容的微处理器。
      3. 检查系统错误日志以获取有关该错误的信息。更换错误日志中标出的任何组件。
    MEM 当仅有 MEM 指示灯点亮时,表示发生了内存错误。
    注: 注:每次安装或卸下 DIMM 时,必须断开节点与电源插座的连接;然后,等待 10 秒再重新启动服务器。
    如果 CONFIG 指示灯未点亮,那么系统可能检测到内存错误。请完成以下步骤来更正此问题:
    1. 更新节点固件。
    2. 重新安装或交换指示灯点亮的 DIMM。
    3. 检查 Setup Utility 中的系统事件日志或 IMM 错误消息。
    4. 更换发生故障的 DIMM。
    MEM + CONFIG

    当 MEM 指示灯和 CONFIG 指示灯都点亮时,表示内存配置无效。

    如果 MEM 指示灯和 CONFIG 指示灯均点亮,请检查 Setup Utility 中的系统事件日志或 IMM2 错误消息。
    TEMP 系统或系统组件温度超过阈值级别。发生故障的风扇会导致 TEMP 指示灯点亮。
    1. 确保已正确安装散热器。
    2. 确定风扇是否发生故障,并在必要时更换风扇。
    3. 确保室温不过高。请参阅环境需求,以获取服务器温度信息。
    4. 确保通风孔未阻塞。
    5. 确保已正确安装适配器或任何其他网络适配器上的散热器或风扇。如果风扇发生故障,请将其更换。
    6. 有关更多信息,请与 IBM 服务代表联系。
    FAN 风扇发生故障、运转过慢或已被卸下。此外,可能还会点亮 TEMP 指示灯。
    1. 检查节点是否安装有双端口网络适配器。如果是,请确保使用安装有四个风扇的配置编译节点。
    2. 重新安装发生故障的风扇,由主板上该风扇接口附近点亮的指示灯来指示。
    3. 更换发生故障的风扇。
    BOARD 主板或系统电池发生了错误。
    1. 检查主板上的指示灯以识别导致该错误的组件。由于以下任何原因,BOARD 指示灯可能点亮:
      • 电池
      • (仅限经过培训的技术人员)主板
    2. 检查系统错误日志以获取有关该错误的信息。
    3. 更换发生故障的组件。
    HDD 硬盘驱动器发生故障或缺失。
    1. 检查硬盘驱动器上的指示灯以查找状态指示灯点亮的驱动器,然后重新安装该硬盘驱动器。
    2. 重新安装硬盘驱动器底板。
    3. 如果该错误仍然存在,请按列出的顺序逐个更换以下组件(每更换一个组件后重新启动服务器):
      1. 更换硬盘驱动器。
      2. 更换硬盘驱动器底板。
    4. 如果问题仍然存在,请与 IBM 服务代表联系。
  3. 继续使用 MAP 5700:修复验证来验证操作是否正确。