Informationen zur Fehlerbehebung

Die Fehlerbehebung stellt einen systematischen Ansatz zur Lösung eines Problems dar. Das Ziel ist zu bestimmen, warum etwas nicht wie erwartet funktioniert und wie das Problem behoben werden kann.

Der erste Schritt im Fehlerbehebungsprozess besteht darin, das Problem ausführlich zu beschreiben. Ohne eine Fehlerbeschreibung können weder Sie noch IBM® wissen, wo mit der Suche nach der Fehlerursache begonnen werden sollte. Zu diesem Schritt gehört, dass Sie sich einige grundlegende Fragen stellen, wie z. B.:

Die Antworten auf diese Fragen führen in der Regel zu einer guten Fehlerbeschreibung. Dies ist die beste Möglichkeit, mit der Fehlerbehebung zu beginnen.

Was sind die Symptome des Problems?

Wenn Sie mit der Beschreibung eines Problems beginnen, ist die nahe liegendste Frage "Worin besteht das Problem?". Diese Frage mag einfach erscheinen, aber Sie können sie in mehrere klarer umrissene Fragen unterteilen, die ein anschaulicheres Bild des Problems erzeugen. Dazu können die folgenden Fragen gehören:
  • Wer oder was meldet den Fehler?
  • Wie lauten die Fehlercodes und -nachrichten?
  • Wie äußert sich der Fehler im System? Handelt es sich z. B. um eine Schleife, eine Blockierung, einen Absturz, um Leistungseinbußen oder um ein falsches Ergebnis?
  • Welchen Einfluss hat der Fehler auf die Geschäftsabläufe?

Wo tritt das Problem auf?

Es ist nicht immer leicht, den Ursprung des Problems festzustellen. Dennoch ist dies einer der wichtigsten Schritte bei der Fehlerbehebung. Zwischen den Berichterstellungskomponenten und den fehlerhaften Komponenten können viele Technologieschichten liegen. Netze, Platten und Treiber sind nur einige wenige Komponenten, die bei der Untersuchung von Problemen berücksichtigt werden müssen.

Die folgenden Fragen können Ihnen helfen, sich auf den Ursprung des Fehlers zu konzentrieren und die fehlerhafte Schicht einzugrenzen.
  • Tritt das Problem nur bei einer Plattform oder einem Betriebssystem auf oder kommt es bei mehreren Plattformen oder Betriebssystemen gleichermaßen vor?
  • Werden die aktuelle Umgebung und die aktuelle Konfiguration unterstützt?
  • Wird die Anwendung lokal auf dem Datenbankserver oder auf einem fernen Server ausgeführt?
  • Ist ein Gateway betroffen?
  • Befindet sich die Datenbank auf einzelnen Platten oder in einem RAID-Plattenstapel?

Beachten Sie dabei, dass der Fehler nicht unbedingt in der Schicht aufgetreten sein muss, die den Fehler meldet. Zur Ermittlung des Fehlerursprungs gehört auch, die Umgebung zu kennen, in der der Fehler auftritt. Nehmen Sie sich genügend Zeit, die Fehlerumgebung vollständig zu beschreiben. Berücksichtigen Sie dabei auch das Betriebssystem, seine Version, die gesamte zugehörige Software mit Versionsangabe und Hardwareinformationen. Stellen Sie sicher, dass Sie in einer Umgebung arbeiten, bei der es sich um eine unterstützte Konfiguration handelt. Viele Probleme können auf inkompatible Softwareversionen zurückgeführt werden, die nicht zusammen ausgeführt werden sollen oder die nicht vollständig zusammen getestet wurden.

Wann tritt das Problem auf?

Entwickeln Sie einen detaillierten Zeitplan der Ereignisse, die zu einem Fehler führen, vor allem in den Fällen, die einmalig auftreten. Am einfachsten ist es, die zeitliche Abfolge rückwärts nachzuvollziehen: Beginnen Sie mit dem Zeitpunkt, zu dem der Fehler gemeldet wurde (möglichst präzise bis auf die Millisekunde) und arbeiten Sie die verfügbaren Protokolle und Informationen rückwärts durch. In der Regel müssen Sie nur bis zum ersten auffälligen Ereignis in einem Diagnoseprotokoll zurückgehen. Dies ist jedoch nicht immer einfach und erfordert Erfahrung. Es ist vor allem dann schwierig zu wissen, wann mit der Suche aufgehört werden kann, wenn mehrere Technologieschichten beteiligt sind und jede Schicht über eigene Diagnoseinformationen verfügt.

Versuchen Sie, die folgenden Fragen zu beantworten, um einen ausführlichen Zeitplan der Ereignisse zu entwickeln:
  • Tritt das Problem nur zu einer bestimmten Uhrzeit auf?
  • Wie oft tritt das Problem auf?
  • Welche Folge von Ereignissen hat sich bis zu der Uhrzeit, zu der das Problem gemeldet wird, ereignet?
  • Tritt das Problem nach einer Änderung der Umgebung auf, z. B. nach einem Upgrade oder einer Installation von Software oder Hardware?
  • Produktspezifische Fragen.

Die Beantwortung dieser Fragen kann Ihnen helfen, einen Rahmen abzustecken, in dem das Problem untersucht werden soll.

Unter welchen Bedingungen tritt das Problem auf?

Die Kenntnis der zum Zeitpunkt eines Problems aktiven anderen Systeme und Anwendungen spielt eine wichtige Rolle bei der Fehlerbehebung. Diese und andere Fragen zu Ihrer Umgebung können Ihnen helfen, die eigentliche Ursache des Fehlers zu ermitteln:
  • Tritt das Problem immer dann auf, wenn eine bestimmte Task ausgeführt wird?
  • Muss eine bestimmte Folge von Ereignissen eintreten, damit das Problem auftaucht?
  • Treten in anderen Anwendungen zur selben Zeit Fehler auf?
  • Produktspezifische Fragen.

Die Beantwortung dieser Arten von Fragen kann Ihnen bei der Beschreibung der Umgebung, in der das Problem auftritt, und beim Korrelieren möglicher Abhängigkeiten helfen. Beachten Sie, dass mehrere Probleme nicht unbedingt in Beziehung zueinander stehen müssen, nur weil sie etwa zur selben Zeit aufgetreten sind.

Kann das Problem reproduziert werden?

Aus Sicht der Fehlerbehebung ist das "ideale" Problem ein Problem, das reproduziert werden kann. Normalerweise stehen Ihnen bei Fehlern, die sich reproduzieren lassen, mehr Tools oder Prozeduren zur Verfügung, die Ihnen bei der Untersuchung helfen. Daher sind Fehler, die Sie reproduzieren können, oft einfacher zu beheben. Reproduzierbare Fehler haben jedoch einen Nachteil: Wenn der Fehler die Geschäftsabläufe entscheidend beeinflusst, wollen Sie ein erneutes Auftreten vermeiden. Reproduzieren Sie den Fehler möglichst in einer Test- oder Entwicklungsumgebung, die Ihnen bei der Untersuchung in der Regel mehr Flexibilität und Kontrolle bietet.
  • Kann das Problem auf einer Testmaschine reproduziert werden?
  • Tritt derselbe Typ von Problem bei mehreren Benutzern oder Anwendungen auf?
  • Kann das Problem durch Ausführen eines einzelnen Befehls, einer Befehlsgruppe, einer bestimmten Anwendung bzw. einer eigenständigen Anwendung reproduziert werden?
  • Produktspezifische Fragen.

Feedback