Fortgeschrittenenkurs Talend Data Integration

Talend Data Integration bietet eine erweiterbare und hochgradig skalierbare Toolpalette zum Aufrufen, Transformieren und Integrieren von Daten aus beliebigen Geschäftssystemen. Dieser Kurs ist so aufgebaut, dass Sie die erweiterten Funktionen von Talend Data Integration so schnell wie möglich einsetzen können. Teilnehmer können im Team gemeinsam an Projekten in einem Remote Repository arbeiten, um Jobs und Datenbankänderungen zu überwachen.

Dauer 1 Tag
(7 Stunden)
Target audience Alle, die Talend Data Integration für Datenintegrations- und Management-Tasks verwenden möchten: Software-Entwickler und Entwicklungsleiter
Prerequisites Grundkurs Talend Data Integration und Kenntnisse im IT-Bereich einschließlich Vertrautheit mit Java oder einer anderen Programmiersprache sowie mit SQL und allgemeinen Datenbankkonzepten
Course objectives

Das lernen Sie in diesem Kurs:

  • Talend Studio starten und eine Verbindung zu einem Remote-Repository aufbauen
  • SVN-Branches in Studio einsetzen
  • Job in Studio oder einem Remote-Job-Server ausführen
  • Host CPU und JVM-Speicher in Echtzeit während der Job-Ausführung überwachen
  • Debugging-Funktionen in Studio verwenden
  • Talend-Projekt zum Erfassen von Statistiken und Logdaten konfigurieren und mit der Activity Monitoring Console (AMC) überwachen
  • Verschiedene Methoden zur parallelen Ausführung in einem Talend-Job implementieren
  • Joblets erstellen
  • Unit-Tests von einem funktionierenden Job erstellen
  • Datenbank für die Überwachung und Protokollierung von Änderungen in einer separaten CDC-Datenbank (Change Data Capture) konfigurieren
  • CDC-Datenbank für inkrementelle Updates zwischen Quelle und Ziel verwenden
  • Ein Referenzprojekt erstellen, um Teile eines anderen Projekts verwenden zu können
Course agenda

Verbindung mit einem Remote Repository herstellen

  • Remote-Verbindung herstellen

SVN in Studio

  • Job in einen Branch kopieren
  • Jobs vergleichen
  • Den Branch zurücksetzen

Referenzprojekt

  • Referenzprojekt
  • Ein Referenzprojekt einrichten und verwenden

Ausführung von Remote Jobs

  • Einen Job remote erstellen und ausführen

Ressourcen-Auslastung und grundlegendes Debugging

  • Ressourcen-Auslastung in Echtzeit mit Memory Run anzeigen
  • Jobs mit Debug Run von Fehlern befreien

Activity Monitoring Console (AMC)

  • Statistiken und Protokollierung konfigurieren
  • Activity Monitoring Console (AMC) verwenden

Parallele Ausführung

  • Große Dateien schreiben
  • In Datenbanken schreiben
  • Automatische Parallelisierung
  • Partitionierung

Joblets

  • Joblets von vorhandenen Jobs erstellen
  • Joblets von Grund auf erstellen
  • Joblets auslösen

Unit-Test

  • Unit-Test erstellen

Change Data Capture (CDC)

  • Datenbanken untersuchen
  • CDC-Datenbank konfigurieren
  • Änderungen überwachen
  • Data Warehouse aktualisieren
  • Datenbank zurücksetzen