Talend Data Preparation mit Big Data

Bei Talend Data Preparation handelt es sich um eine Self-Service-Anwendung, mithilfe derer Information Worker Daten für die Analyse und für andere datengesteuerte Aufgaben vorbereiten können. Dieser Kurs zeigt Ihnen, wie Sie mithilfe von Talend Data Preparation sofort auf Ihren Data Lake zugreifen und Vorbereitungs- und Integrationstools so kombinieren, dass in einem Hadoop Distributed File System (HDFS) gespeicherte Big Data-Dateien korrigiert werden können.

Sie lernen, wie Sie Datensätze aus im HDFS gespeicherten Daten erstellen und bereinigte Daten ins Cluster exportieren. Sie verbessern Ihre Data Preparation-Kenntnisse, indem Sie Big Data-Dateien bereinigen. Sie lernen ebenfalls, wie Sie mithilfe von Talend Studio mit dem Spark-Framework Vorbereitungen am Hadoop-Cluster ausführen.

Dauer 1/2 Tag
(4 Stunden)
Target audience Alle, die mithilfe von Talend Data Preparation Big Data-Dateien bereinigen und strukturieren möchten.
Prerequisites Talend Data Preparation für Ausführende und Grundkurs Talend Big Data
Course objectives

Das lernen Sie in diesem Kurs:

  • Datensätze aus im HDFS gespeicherten Daten erstellen
  • Vorbereitungen erstellen, um Big Data-Dateien zu bereinigen
  • Vorbereitungen in das HDFS exportieren
  • Benutzerdefinierte Data Preparation in einem Spark-Batch-Job ausführen
  • Benutzerdefinierte Data Preparation in einem Spark-Streaming-Job ausführen
Course agenda

Talend Data Preparation in einem Big Data-Kontext

  • Konzepte und Ziele

Erste Schritte

  • Hadoop-Cluster überwachen
  • Cluster-Metadaten erstellen
  • Daten im Cluster generieren
  • Big Data-Jobs überwachen

In HDFS gespeicherte Daten bearbeiten

  • Datensatz aus einer HDFS-Quelle erstellen
  • Eine Vorbereitung aktualisieren
  • Vorbereitung in das HDFS exportieren

Vorbereitung in einem Big Data-Batch-Job ausführen

  • Spark-Batch-Job einrichten
  • Spark-Batch-Job aktualisieren

Vorbereitung in einem Big Data-Streaming-Job ausführen

  • Streaming-Jobs importieren
  • Datensatz und Vorbereitung erstellen
  • Vorbereitung in einem Big Data-Streaming-Job verwenden