Ein Tag im Leben eines Datenintegrationsentwicklers: Ausführen, Testen und Debuggen [Teil 3]

In diesem Teil der Reihe Ein Tag im Leben eines Datenintegrationsentwicklers widmen wir uns dem Ausführen von Prozessen bzw. Jobs, dem Testen und dem Debuggen in Talend Studio. Im Video und auf dieser Seite werden verschiedene Methoden zum Ausführen von Jobs gezeigt und Tests mit kleinen Datensätzen durchgeführt. Außerdem erfahren Sie, wie Sie Protokollierungsfunktionen zum Debuggen einsetzen und die integrierte Debugging-Funktion von Studio nutzen.

Debugging-Methode 1

Hier sehen Sie einen einfachen Prozess, mit dem Daten aus einer großen Datei gelesen, aggregiert und in eine Tabelle geschrieben werden.

Screenshot Talend Studio

Wenn Sie die Funktion Run auf der gleichnamigen Registerkarte aufrufen und auf Debug klicken, können Sie die Schaltfläche Next auswählen, damit der Job erstellt und der Prozess ausgeführt wird. Dabei können Sie beobachten, wie die Daten jede Transformation mit all den Attributen durchlaufen.

Die Datei enthält mehrere Spalten und wird von der tMap reduziert. Jetzt möchte ich den Datensatz reduzieren, um die Menge der Daten zu verringern, die hier verarbeitet werden.

Wenn ich auf die Komponente der Datei klicke, wird ein Feld zum Begrenzen angezeigt und ich kann 10 Felder angeben. Wenn ich jetzt wieder Run, Debug, Run aufrufe, wird der gesamte Prozess mit nur 10 Einträgen abgeschlossen, indem ich zehnmal auf die Schaltfläche Next klicke.

Dabei sehe ich die Debug-Attribut-Features in allen Komponenten. Ich kann sie klicken und ziehen und verschieben, um eine bessere Übersicht darüber zu erhalten, was tatsächlich in die Datenbank geschrieben wurde. Außerdem wird mir die Sequenz angezeigt, die in der tMap erstellt wird.

Debugging-Methode 2

Eine weitere Möglichkeit zum Debuggen des Prozesses besteht darin, mithilfe der Komponente tLogRow die Bildschirmausgabe in Studio hinzuzufügen und die Ausgabe der letzten tMap mit der tLogRow zu verknüpfen.

Dazu mache ich aus der Ausgabezeile eine neue Ausgabezeile in der tMap. Wenn ich hier einfach in die tMap gehe, kann ich die gewünschten Attribute per Drag-and-drop von der tLogRow in die tMap ziehen, um sie zu verbinden.

Screenshot Talend Studio

Wenn Sie die Sequenz hinzufügen müssen, um sicherzustellen, dass sie richtig generiert wird, fügen Sie eine neue Spalte hinzu.

Screenshot Talend Studio

Wir nennen diese Spalte seq für Sequenz. Da sie Ganzzahlwerte enthalten muss, ändere ich den Spaltentyp zu int (Integer, Ganzzahl). Dann füge ich im Expression-Builder eine Funktion hinzu und gebe die numerische Sequenz ein. Jetzt habe ich eine einsatzbereite Sequenz.

Wenn ich die Daten in einem schöneren Format anzeigen möchte, z. B. einem Tabellenformat, dann kann ich das einfach ändern. Vielleicht möchte ich mehr Zeilen haben, um mehr Ausgabewerte zu sehen. Dazu ändere ich die Ausgabe einfach zu 100 Zeilen in der Datei. Und wenn ich den Vorgang im normalen Ausführungsmodus laufen lasse, wird die gesamte aggregierte Datenausgabe zusammen mit den Sequenznummern auf dem Bildschirm angezeigt.

Weitere Informationen zu diesen zwei Debugging-Methoden finden Sie im obigen Video. Im nächsten Tutorial erfahren Sie mehr über grundlegende Designfunktionen.

| Zuletzt aktualisiert: August 7th, 2019