Clevere Deals mit Talend

Talend Data Integration bei Groupon
Talend ist günstig, einfach zu bedienen, leicht anpassbar und enorm vielseitig. Eine große Zahl an Quellsystemen lässt sich mit den vorhandenen Konnektoren direkt anbinden, dabei hilft die grafische Benutzeroberfläche enorm.
Rafael Herrera, , Head of BI International bei Groupon

Der Kunde

Groupon wurde im November 2008 in Chicago gegründet und ist mittlerweile schon in über 1.000 Städten in 48 Ländern vertreten. Von New York bis Hong Kong, von Oslo bis Kapstadt – Groupon ist als Social-Shopping-Anbieter nicht mehr wegzudenken. Auf der Groupon-Plattform werden täglich tausende neue Deals eingestellt. Das Unternehmen beschäftigt weltweit über 10.000 Mitarbeiter. Innerhalb des Groupon-Konzerns nimmt der Standort Berlin eine besondere Rolle ein: Von hier aus werden IT, Produktmanagement und Online-Marketing für mehr als 35 Länder gesteuert.

Das Geschäftsmodell von Groupon hat die Kundenansprache revolutioniert: Egal, ob Unternehmen neue Kunden akquirieren, Produkte verkaufen oder Reisearrangements an den Mann bringen wollen – Groupon-Deals erreichen mehr Menschen in kürzerer Zeit und gezielter als jede Alternative. Heute lassen sich weltweit hunderte Millionen Newsletter-Abonnenten und Smartphone-Nutzer über Angebote an ihren Lieblingsorten oder spezielle Online-Deals informieren. Das Erfolgsrezept: Unschlagbare Preise bei ausgesuchten lokalen Händlern finden Kunden, die Lust haben, ihre Umgebung täglich neu zu entdecken.

Die Herausforderung

Bei Groupon stellt die IT-Infrastruktur das Rückgrat der unternehmerischen Aktivitäten dar. Das rasante Wachstum vom Start-Up zum börsennotierten Internet-Riesen in wenigen Jahren hat jedoch die IT vor enorme Herausforderungen gestellt. Insbesondere die Datenmengen sind nicht einfach zu handhaben und Daten sind das Lebenselixier von Groupon. Jeden Tag fällt mehr als ein Terabyte an Rohdaten an, die nahezu in Echtzeit verarbeitet und in verschiedenen Datenbanksystemen abgelegt werden müssen.

Von Berlin aus werden die Daten aus über 30 Ländern verarbeitet, neben Europa sind das Latein-amerika, Asien und die Pazifikregion einschließlich Australien und Neuseeland. Für die Unternehmens-steuerung verwendet Groupon ein Business-Intelligence-System bestehend aus einem Data-Warehouse auf Basis einer Teradata-Datenbank sowie Microstrategy als Frontend für die Erstellung von Reports. Um Daten aus unterschiedlichen Quellen in das Data-Warehouse zu laden, sie zu transformieren und aus dem Data-Warehouse wiederum in verschiedene  Zielsysteme zu laden, setzt Groupon auf die Integrationslösung von Talend.

Die Talend-Lösung

„Als klassisches Start-Up haben wir mit einer fast zu hundert Prozent auf Open-Source-Technologie basierenden IT begonnen. Entscheidend war neben den Kosten immer die Skalierbarkeit, weil sich bei Groupon sehr schnell ein rasantes Wachstum abzeichnete“, erinnert sich Rafael Herrera, Head of BI International bei Groupon. „Inzwischen setzen wir auch proprietäre Lösungen ein, aber das Lizenzmodell ist für mich nicht entscheidend. Talend ist eine der Open-Source-Technologien, die bei uns bis heute eine wichtige Rolle spielen.“

Seit 2011 ist Talend die zentrale Datenintegrationsplattform bei Groupon. Anfangs setzten die Verantwortlichen auf die kostenlose Community Version Talend Open Studio, aber nach den ersten erfolgreich umgesetzten Jobs entschied man sich schnell für die Talend Data Integration Team Edition. Zum Einsatz kommt derzeit die Version 5.2.

Insgesamt laufen täglich knapp 1.000 unterschiedliche Datenintegrationsjobs (ETL: Extract, Transform, Load) bei Groupon. Einige davon laufen einmal pro Tag, andere stündlich oder sogar deutlich häufiger. Die Talend-Lösung lädt parallel Daten in verschiedene Datenbanken – zum Einsatz kommen neben der Hauptdatenbank von Teradata noch PostgreSQL- und Exasol-Datenbanken – und Salesforce. Die wichtigsten Quellsysteme sind das E-Mail-Marketing sowie das OLTP-System (Online Transaction Processing).

Das E-Mail-Marketing generiert als ein zentrales Tool von Groupon den Hauptteil der Daten. Es gilt, das Marketing immer exakter an die Zielgruppe anzupassen. All diese Daten aus über 30 Ländern werden ebenfalls mit Talend in das Data-Warehouse geladen. Für die Abwicklung der Transaktionen nutzt Groupon eine OLTP-Lösung (Online Transaction Processing), die auf Open-Source-Technologie basiert und eine PostgreSQL-Datenbank nutzt. Täglich werden damit Millionen von Transaktionen abgewickelt. Die Daten aus dem OLTP-System werden mit Talend im 5-Minuten-Rhythmus in das Teradata Data-Warehouse repliziert. Als CRM-Werkzeug (Customer Relationship Management) setzt Groupon Salesforce ein. Die Kundendaten werden aus verschiedenen Systemen in Salesforce geladen und dann stündlich mit dem Data-Warehouse abgeglichen, um einen „Single Point of Truth“ für alle Kundendaten zu haben.

Vorteile

„Talend ist günstig, einfach zu bedienen, leicht anpassbar und enorm vielseitig. Eine große Zahl an Quellsystemen lässt sich mit den vorhandenen Konnektoren direkt anbinden, dabei hilft die grafische Benutzeroberfläche enorm. Für die Anbindung der Teradata-Datenbank mussten wir allerdings selbst einige Komponenten entwickeln. Das war für unsere internen Entwickler aber kein Problem“, fasst Rafael Herrera zusammen.

Die gesamte Datenintegration mit Talend dient in erster Linie dem Zweck, immer möglichst aktuelle Daten aus den unterschiedlichsten Systemen – von Salesforce CRM über E-Mail-Marketing bis hin zum OLTP-System – im Data-Warehouse bereitzustellen. Diese Daten stehen aggregiert dann Sales-Consultants vor Ort genauso zur Verfügung wie den Vertriebsleitern, die damit den Vertrieb steuern.

„Unser Geschäftsmodell bringt es mit sich, dass wir sehr viele Daten sehr schnell analysieren können müssen, um Entwicklungen und Trends frühzeitig zu erkennen. Die Integrationslösungen von Talend stellen sicher, dass unser Data-Warehouse immer hoch-aktuell ist und die Realität möglichst exakt abbildet“, kommentiert Rafael Herrera. „Fakt ist, dass informationsgestützte Entscheidungen immer nur so gut sein können, wie die zugrunde liegenden Informationen. Nicht zuletzt dank Talend sind unsere Informationen sehr gut.“