Fortgeschrittenenkurs Talend Big Data – Machine Learning

Talend stellt eine Entwicklungsumgebung bereit, die Ihnen das Interagieren mit zahlreichen Big Data-Quellen und -Zielen auch ohne das Erlernen und Schreiben von kompliziertem Code gestattet.

Dieser Kurs behandelt die Implementierung von Algorithmen des maschinellen Lernens in Big Data Batch Jobs unter Verwendung des Spark-Frameworks.

Dauer 1 Tag
(7 Stunden)
Target audience Alle, die Algorithmen des maschinellen Lernens mit Talend Studio implementieren möchten
Prerequisites Grundkurs Talend Data Quality oder Grundkurs Talend Big Data
Course objectives

Das lernen Sie in diesem Kurs:

  • Aus einem Talend-Job heraus eine Verbindung mit einem Hadoop-Cluster herstellen
  • Kontextvariablen und Metadaten verwenden
  • Dateien in HDFS in einem Big Data Batch Job lesen und schreiben
  • Big Data Batch Jobs für die Verwendung des Spark-Frameworks konfigurieren
  • Empfehlungsmodelle erstellen und testen
  • Klassifizierungsmodelle erstellen und testen
  • Daten mit Algorithmen des maschinellen Lernens deduplizieren
Course agenda

Kontext für maschinelles Lernen

  • Konzepte

Anwendungsfall SMS-Klassifizierung

  • Hadoop-Cluster überwachen
  • Anwendungsfall „SMS-Klassifizierung erkunden“ – Entscheidungsbäume
  • Mit Ihrem Hadoop-Cluster verbinden
  • SMS-Klassifizierungsmodell erstellen
  • SMS-Klassifizierungsmodell testen

Anwendungsfall Filmempfehlung

  • Anwendungsfall „Filmempfehlung erkunden“ – alternierende kleinste Quadrate
  • Filmempfehlungsmodell erstellen
  • Filmempfehlungsmodell testen

Anwendungsfall Schwertlilien-Klassifizierung

  • Anwendungsfall „Schwertlilien-Klassifizierung erkunden“ – Bayes-Klassifikator
  • Schwertlilien-Klassifizierungsmodell erstellen
  • Schwertlilien-Klassifizierungsmodell testen

Anwendungsfall Deduplizierung Kinderbetreuung

  • Anwendungsfall „Kinderbetreuung erkunden“ und Datensatzzuordnung
  • Umgebung einrichten
  • Bildung von Datenpaaren
  • Zuordnungsmodell erstellen
  • Zuordnungsmodell verwenden
  • Duplikatgruppen zusammenführen