Fortgeschrittenenkurs Talend Data Mapper – Spark

Talend Data Mapper (TDM) bietet zahlreiche spezialisierte Komponenten an, mithilfe derer Sie in Spark-typischer Geschwindigkeit hierarchische Dateien bearbeiten können.

In diesem Kurs erfahren Sie, wie Sie Big Data-Batch- oder Streaming-Jobs erstellen und TDM-Mappings aus diesen Jobs abrufen können. Am Ende des Kurses wissen Sie, wie man hierarchische Dateien und Ströme aus hierarchischen Datensätzen transformiert.

Duration1 Tag (7 Stunden)
Target audience Java-Anwendungsentwickler und Software-Architekten
PrerequisitesCompletion of Talend Data Integration Basics and Talend Data Mapper Essentials
Course objectives

Das lernen Sie in diesem Kurs:

  • TDM-Mappings in Big Data-Batch- und Streaming-Jobs aufrufen
  • Grundlagen von Spark, Spark-Streaming und Kafka verstehen
  • TDM-Komponenten für Big Data-Jobs verwenden
  • Mehrere Ausgaben an TDM-Big Data-Komponenten aktivieren
Course agenda

Kontext für Spark

  • Konzepte

Verbindung mit Hadoop-Cluster

  • Schulungsprojekt öffnen
  • Hadoop-Cluster überwachen
  • Cluster-Metadaten erstellen

Kontext TDM für Spark

  • Konzepte

Dateien konvertieren

  • Dateiformate konvertieren

Dateien transformieren

  • Dateien transformieren – einfache Ausgabe
  • Dateien transformieren – Mehrfachausgabe

Dateien verarbeiten

  • Hierarchische Daten in Dateien verarbeiten

Datenströme verarbeiten

  • Grundlagen von Kafka verstehen
  • Datensatzströme bearbeiten