Probieren Sie es aus! Durchführung einer Geschäftsregelanalyse mit Talend Data Quality

Durchführung einer Geschäftsregelanalyse

Zusammenfassung der Aufgabe

Mit der Geschäftsregelanalyse können Sie Ihre Daten anhand der von Ihnen definierten Geschäftsregeln auf Anomalien prüfen.

Nachdem Sie Talend Studio gestartet haben, stellen Sie eine Verbindung zum lokalen Datenbankserver her. Anschließend legen Sie im Repository eine SQL-Geschäftsregel fest. Zum Schluss erstellen Sie eine Geschäftsregelanalyse und verbinden die Geschäftsregel damit.

Ihre Trainingsumgebung verwendet eine einzige virtuelle Maschine (VM), in der die gesamte für dieses Tutorial erforderliche Software enthalten ist, inklusive Talend Studio und MySQL.

Talend Studio starten

    1. Um die virtuelle Maschine zu starten, öffnen Sie einen neuen Tab mit der gleichen Seite und klicken Sie auf diesen Link

    2. Wählen Sie unter Networks auf der rechten Seite Ihres Bildschirms Yes aus.

    3. Um Studio auf Ihrem VM Desktop zu starten, doppelklicken Sie auf die Verknüpfung Talend Studio.

    4. Daraufhin öffnet sich das Fenster „Talend Data Fabric“.

      Sie sehen ein Projekt mit dem Namen „DQ Essentials“.

      Klicken Sie auf Finish.

    5. Vergewissern Sie sich, dass der Startbildschirm erscheint.

    6. Klicken Sie auf den Button Start now! (eventuell müssen Sie dazu nach unten scrollen).

      Daraufhin öffnet sich das Fenster.

Entsprechend Ihren Einstellungen und den verfügbaren Tools kann Ihr Bildschirm davon abweichen.

Sie können die häufig verwendeten Bereiche sehen:

    • Das DQ Repository, in dem Datenanalysen und Metadaten gespeichert sind, finden Sie oben links.
    • Der Arbeitsbereich, in dem Sie Jobs erstellen und bearbeiten, Analysen durchführen und Ergebnisse prüfen, befindet sich in der Mitte.

Metadaten zur Datenbankverbindung angeben

  1. Vergewissern Sie sich, dass Sie sich in der Perspektive „Profiling“ befinden. Klicken Sie oben rechts auf das Symbol Profiling:

  2. Geben Sie die Metadaten an. Im DQ Repository erweitern Sie Metadata.

    Klicken Sie mit der rechten Maustaste auf DB connections und klicken Sie anschließend auf Create Connection.

    So erstellen Sie eine Verbindung zu einer Reihe von Datenbanken, die bereits in Ihrer Trainingsumgebung konfiguriert sind.

    1. Geben Sie im Textfeld Name StagingDB ein.

    2. Klicken Sie auf Next.
    3. Klicken Sie in der Auswahlliste DB Type auf MySQL. Ändern Sie dabei nicht den Standardwert bei "Db Version“.

    4. Geben Sie diese Einstellungen ein:

      • Geben Sie bei Login und Password root ein.
      • Geben Sie bei Server localhost ein.
      • Lassen Sie das Textfeld bei DataBase leer (damit Sie auf alle im lokalen Server konfigurierten Datenbanken zugreifen können).
    5. Um Ihre Verbindungsinformationen zu prüfen, klicken Sie auf den Button Check.

    6. Klicken Sie im Fenster „Check Connection“ auf OK oder nehmen Sie die erforderlichen Änderungen vor und klicken Sie noch einmal auf Check.
    7. Klicken Sie auf Finish.

      Ihre neue Datenbankverbindung, StagingDB, erscheint im Repository.

      Im Arbeitsbereich werden die Konfigurationsinformationen für die Verbindung angezeigt.

      Ändern Sie bei Bedarf die Verbindungseinstellungen.

Eine Geschäftsregelanalyse erstellen

  1. Erstellen Sie eine Geschäftsregel.

    1. Erweitern Sie im Repository Libraries und anschließend Rules.

    2. Klicken Sie mit der rechten Maustaste auf den Ordner SQL und klicken Sie dann auf New Business Rule.

      Füllen Sie die Textfelder bei Name, Purpose und Description aus und klicken Sie auf Next.

    3. Geben Sie im Textfeld Where clause Begin_dt<End_dt ein.

      Damit stellen Sie sicher, dass der Wert für das Enddatum größer ist als der Wert für das Startdatum.

    4. Klicken Sie auf Finish. Die neue Regel erscheint im Feld „Where Clause“ unter „Data Quality Rule“.

    5. Die neue Geschäftsregel erscheint jetzt im Repository.

  2. Erstellen Sie eine Geschäftsregelanalyse.

    Klicken Sie mit der rechten Maustaste auf den Ordner CRM_Analyses und wählen Sie New Analysis aus.

    1. Erweitern Sie Table Analysis und klicken Sie auf Business Rule Analysis.

    2. Benennen Sie die Analyse Contract_Dates_Analysis und klicken Sie auf Next.

    3. Um die Tabelle, die Sie analysieren möchten, zu identifizieren, erweitern Sie DB Connections und danach den Katalog crm. Klicken Sie anschließend auf die Tabelle contract.

    4. Klicken Sie auf Next.

    5. Erweitern Sie Rules und SQL. Wählen Sie dann die zuvor erstellte Geschäftsregel Contract_Dates aus.

    6. Klicken Sie auf Finish.

      Im Bereich „Analyzed Tables“ bekommen Sie die Informationen angezeigt, die Sie zuvor angegeben haben, um die Analyse zu erstellen.

    7. Führen Sie die Analyse durch.

  3. Prüfen Sie die Ergebnisse der Analyse.

    Rund 99 % der Daten werden als gültig angezeigt und 1 % als ungültig.

    Klicken Sie mit der rechten Maustaste auf den Indikator Contract_Dates und klicken Sie danach auf View invalid rows.

In diesem Tutorial haben Sie Talend Studio gestartet und mit Perspektiven gearbeitet. Sie haben Informationen zur Datenbankverbindung als Metadaten im DQ Repository angegeben und gespeichert. Zum Schluss haben Sie erfahren, wie Sie eine Geschäftsregel im DQ Repository erstellen und in einer Geschäftsregelanalyse wiederverwenden.

Sie haben das Tutorial abgeschlossen.

| Zuletzt aktualisiert: August 12th, 2019