ETL mit Salesforce

Die Salesforce-Plattform gehört mit ihrer Palette an Cloud-Services weiterhin zu den wichtigsten Tools in der CRM-Landschaft. Beliebt ist die Plattform insbesondere aufgrund ihrer Funktionen und Vielseitigkeit und ihrer Integrationsmöglichkeiten mit anderen Anwendungen und Plattformen. In diesem Artikel befassen wir uns mit diesen Integrationen und sagen Ihnen alles, was Sie wissen müssen, um sich auf ETL mit Salesforce vorzubereiten.

Laden Sie The Definitive Guide to Data Integration jetzt herunter.
HERUNTERLADEN

Was ist Salesforce?

Mit einem Marktanteil von 19,6 Prozent ist Salesforce die führende cloudbasierte Customer-Relationship-Management(CRM)-Plattform. Salesforce bietet eine große Bandbreite an Anwendungen für die Verwaltung von Geschäftsprozessen, etwa im Vertrieb, Kundenservice, Marketing und E-Commerce. Zu den bekanntesten Funktionen gehören die Speicherung und Verwaltung von Kundenkonten, Marktdatenanalysen und Business-Intelligence.

Salesforce ebnete bereits 1999 den Weg für das Software-as-a-Service(SaaS)-Konzept, als das Unternehmen begann, CRM-Lösungen in der Cloud anzubieten. Bis dahin setzten die meisten Unternehmen auf die Erstellung eigener CRM-Lösungen, die zum einen kostspielig waren und gleichzeitig viele Jahre bis zur Fertigstellung brauchten.

Heute, zwei Jahrzehnte später, kommen die Salesforce-Anwendungen in einer Reihe unterschiedlicher Industrien und Märkte zum Einsatz, angefangen bei kleinen Start-ups bis hin zu großen Unternehmen wie GE, Vodafone, Coca Cola und Air Asia. Salesforce-Produkte werden jetzt in vielen gemeinnützigen Organisationen, Behörden und Unternehmen im privaten Sektor eingesetzt. Zu den bekanntesten Salesforce-Anwendungen gehören Sales Cloud, Marketing Cloud und Service Cloud.

Die meisten User nutzen mehr als nur eine Salesforce-Anwendung. Schneider Electric ist ein typisches Beispiel: Das Unternehmen begann 2010 mit einer einzigen Salesforce-CRM-Lösung, hat aber mittlerweile zusätzliche 30 Salesforce-Anwendungen implementiert.

ETL mit Salesforce

Nachdem wir uns jetzt mit Salesforce befasst haben, werfen wir einen Blick auf die Datenintegration. Warum ist sie so wichtig für Unternehmen, die ihre Datenquellen straffen, vereinfachen oder konsolidieren möchten?

Einfach gesagt, geht es bei der Datenintegration darum, Daten aus unterschiedlichen internen und externen Quellen in einem einzigen zentralen Repository zusammenzuführen. So kann es etwa sein, dass ein Unternehmen Kundendaten in einer veralteten Datenbank gespeichert hat, Bestandsdaten mit einer Drittanbieterplattform verwaltet und weitere Daten über Anwendungen erfasst, die vielleicht früher einmal gute Dienste geleistet haben.

Solche Beispiele sind nicht ungewöhnlich. Wenn Unternehmen wachsen und sich verändern, entwickeln sich auch ihre Software- und Datenanforderungen weiter. Strategien, die früher sinnvoll waren, müssen dann auf den Prüfstand gestellt werden. Genau hier kommt die Datenintegration ins Spiel.

Herzstück der Datenintegration ist der ETL-Prozess (ETL = Extraktion, Transformation, Laden). Bei der Datenintegration werden zunächst Daten aus verschiedenen Quellen extrahiert und in ein zentrales Data-Warehouse eingespielt (in Unternehmen, die kein Data-Warehouse nutzen, ist der Prozess ähnlich; dort werden die Daten allerdings direkt in die Quelle integriert). Um den Integrationsprozess zu vereinfachen, bietet Salesforce eine Reihe verschiedener Schnittstellen wie REST-, SOAP- und BULK-APIs. Mithilfe dieser Schnittstellen kann man eine Verbindung zu großen Datenmengen herstellen und diese auch extrahieren.

Während der Transformation werden die Daten bereinigt, geprüft, dedupliziert, organisiert und standardisiert. Zu diesem Punkt kommunizieren die verschiedenen Datensätze bereits miteinander. Schließlich werden die frisch konvertierten Daten in das Zielsystem geladen (bzw. dort bereitgestellt).

Laden Sie The Cloud Data Integration Primer jetzt herunter.
HERUNTERLADEN

Welche Vorteile bietet die Verlagerung Ihrer Daten nach Salesforce?

Bessere Erkenntnisse

Isolierte Daten sind einfach nicht so nützlich wie allgemein zugängliche Daten. Ihre Salesforce-Anwendung enthält wichtige Informationen zu Ihren Kunden, doch wenn Sie diese Daten nicht in Ihre anderen Plattformen integrieren, bleiben Ihnen wichtige Erkenntnisse, Muster oder Trends verborgen.

Mehr Effizienz

Bei der Einführung neuer Anwendungen können Sie mithilfe der Datenintegration Daten aus der neuen Anwendung automatisch in einer einzigen Ansicht verfügbar machen. Weil Sie sich nicht in mehreren Systemen anmelden müssen, um Daten zu erfassen, können Sie Zeit beim Reporting und bei der Analyse sparen.

Bessere Datenqualität

Bei der Datenintegration werden Fehler und Inkonsistenzen korrigiert, was das Vertrauen in die Daten steigert.

Tiefergehende Datenanalysen

Bei der Datenintegration wird mehr Kontext zu den Daten hinzugefügt, sodass man einen Blick für das große Ganze erhält. Sie unterstützt verschiedene Berichte und Dashboards, die für eine schnellere Analyse sorgen, sowie Big-Data-Analysen – für Unternehmen, die wettbewerbsfähig bleiben möchten, ein essenzielles Instrument.

Datenmigration und -integration – was ist der Unterschied?

Bevor wir fortfahren, sollte der Unterschied zwischen Datenintegration und Datenmigration klar sein. Die Begriffe werden manchmal synonym verwendet, aber tatsächlich handelt es sich um unterschiedliche Prozesse. Ein paar Implementierungsmethoden haben sie allerdings gemeinsam.

Bei der Datenintegration werden Daten aus verschiedenen internen und externen Quellen in einer zentralen Ansicht zusammengeführt. Ziel ist es, eine „einzige Version der Wahrheit“ zu schaffen, die bessere geschäftliche Erkenntnisse ermöglicht. Beispielsweise kann man durch die Integration von Salesforce mit anderen Marketingsystemen Leadgenerierung und Channel-Strategien verbessern. Die Datenintegration besteht aus einer Reihe kleinerer, aufeinander abgestimmter Prozesse. Mit anderen Worten geht es bei der Datenintegration darum, ein Gesamtbild zu schaffen.

Bei der Datenmigration werden dagegen Daten aus einem System in ein anderes verschoben. Wenn ein Unternehmen von seinem bestehenden CRM-System auf Salesforce wechseln oder die Version upgraden möchte, muss es alle Daten aus dem aktuellen System in das neue migrieren. Die Datenmigration ist also etwas spezifischer als die Datenintegration.

Ansehen Getting Started with Data Integration jetzt herunter.
Jetzt ansehen

Gängige Integrationsmethoden

Bisher ging es allgemein um den Datenintegrationsprozess und darum, wie Daten aus unterschiedlichen Quellen in einer einzigen Ansicht bzw. Quelle zusammengeführt werden. Im Folgenden nehmen wir die unterschiedlichen Datenintegrationsmethoden unter die Lupe.

Manuelle Datenkonsolidierung

Ihre Daten müssen in ein einheitliches Repository verlagert werden, zum Beispiel durch eine manuelle Konsolidierung. In der Regel kommen hierbei konventionelle ETL-Prozesse zum Einsatz, doch einige Unternehmen nutzen auch benutzerdefinierte integrierte Tools. Bei kleineren, einfacheren Datensätzen, die nicht umfassend bereinigt werden müssen, mag die manuelle Konsolidierung vielleicht funktionieren, aber für größere Datensätze könnte der Prozess zu zeitintensiv und fehleranfällig sein. Weil hier außerdem keine Echtzeitdaten im Spiel sind, ist der Nutzen eher begrenzt.

Propagierung von Daten mittels Anwendungen

Ziel ist es hier, die Daten aus den einzelnen Anwendungen in ein einheitliches Data-Warehouse zu übertragen. Die hierfür nötige Integrationslogik findet man direkt in den einzelnen Vertriebsanwendungen. Anstatt ein gemeinsames Tool oder einen gemeinsamen Ansatz zu haben, um Daten in das Warehouse zu verlagern, überträgt jede Anwendung ihre Daten eigenständig in den zentralen Speicher. Diese Methode eignet sich besonders, wenn die Daten einer umfassenden Bereinigung und Anpassung bedürfen. Die Anwendungen sind hier am besten in der Lage, diese Vorgänge zu verstehen und auszuführen.

Allerdings ist die Pflege bei diesem Ansatz schwierig, weil es in den Anwendungen oft zu Änderungen kommt und die Integrationslogik daher neu erstellt oder angepasst werden muss.

Propagierung von Daten mittels Middleware

Ähnlich wie bei der vorherigen Methode besteht auch hier das Ziel darin, Daten in ein Warehouse zu übertragen. Allerdings wird hier die Integrationslogik von den Anwendungen abstrahiert und die Verantwortung auf die Middleware übertragen. Zum Beispiel stellt ein zwischen Salesforce und dem Data-Warehouse konfigurierter Publish-Subscribe-Mechanismus sicher, dass bei jedem Update ein Ereignis ausgelöst wird, um die Daten automatisch im Warehouse bereitzustellen, sodass es stets auf dem neuesten Stand ist.

Wenn es in den Anwendungen zu Veränderungen kommt, agiert die Middleware weiterhin als Brücke, um die Daten in den zentralen Speicher zu übertragen.

Für diese Methode ist allerdings eine Implementierungsebene nötig, die diese Daten anpasst und in ein Format transformiert, das der Verbraucher (Warehouse) versteht. Außerdem könnte es bei großen Datenmengen zu geringen Verzögerungen zwischen Publisher und Verbraucher kommen, was für einige Anwendungen, die auf Echtzeitdaten angewiesen sind, zu Problemen führen kann.

Datenvirtualisierung

Bei der Virtualisierung werden Daten nicht extrahiert und in einem gemeinsamen Repository gespeichert. Stattdessen bietet sie einen Mechanismus, um auf Daten aus mehreren Quellen zuzugreifen und über ein Front-End anzuzeigen.

Der Vorteil liegt darin, dass man kein Warehouse erstellen und verwalten muss und es nicht zu Verzögerungen bei den Daten kommt. Die Virtualisierung eignet sich perfekt für extrem sichere Anwendungen, die für die Daten keinen anderen Speicherort vorsehen. Allerdings sind die Nutzungsmöglichkeiten der Daten eher begrenzt. Weil sich etwa die Datenherkunft nicht immer lückenlos darstellen lässt, kann es eine echte Herausforderung sein, Erkenntnisse aus den Daten zu gewinnen. Ein zusätzlicher Nachteil ist, dass diese Lösung kein schlankes Front-End bietet, da laufend unterschiedliche Datenquellen abgefragt werden.

Laden Sie ETL mit Salesforce jetzt herunter.
Weitere Informationen

Die Herausforderungen der Datenintegration

Im Rahmen der Progress-Dimensional Research-Umfrage mit Salesforce-Nutzern gaben 54 Prozent der Teilnehmer an, dass die Integration von Anwendungen und Datenquellen ihre größte Herausforderung ist. Im Folgenden erläutern wir die Gründe, warum die Datenintegration nach wie vor für Schwierigkeiten sorgt:

Komplexität der Systeme

Das Zusammenführen von Daten, die aus vielen verschiedenen Systemen stammen, diverse Technologien nutzen und auf verschiedene Standorte verteilt sind, kann eine komplexe Aufgabe sein. Die Größe, der Umfang und die Komplexität dieses Prozesses erfordern eine fehlerlose Planung und Koordinierung.

Daten-Mapping

Da Datenfelder in der Regel mit unterschiedlichen Namen und Typen in den Datenquellen gespeichert werden, ist es nicht ohne Weiteres möglich, jedes Feld dem Zielsystem zuzuordnen. Bei einigen Datenquellen könnte es sich auch um veraltete Systeme mit erheblichen Lücken in den Daten handeln. Um diese Probleme zu lösen, müssen Stakeholder mit extrem guten Datenkenntnissen aus dem operativen und technischen Bereich zusammenarbeiten.

Die richtigen Experten finden

Für die Integration von Salesforce mit einem Data-Warehouse sind unterschiedliche Experten erforderlich, zum Beispiel für Salesforce-, CRM-, Data-Warehouse- (oder Data Lake) und Integrationstechnologien. Ein solches Team zusammenzustellen und dafür zu sorgen, dass alle effektiv miteinander kommunizieren, kann ziemlich schwierig sein.

Definition einer einheitlichen Datenintegrationsstrategie

Neben der cloudnativen Anwendung Salesforce können in Unternehmen auch weitere Quellen in der Cloud oder in lokalen Systemen vorhanden sein. Für die Konsolidierung dieser verschiedenen cloudbasierten und lokalen Quellen sind unter Umständen unterschiedliche Datenintegrationsansätze nötig, die wiederum zu einem uneinheitlichen Umgang mit Daten führen können – was die Datenqualität beeinträchtigt. Eine einheitliche Strategie zu erstellen, die trotz unterschiedlicher Systeme eine optimale Datenintegrität und -synchronisierung sicherstellt, ist keine leichte Aufgabe.

Kontinuierliche Datenintegration

Die Datenintegration ist keine einmalige Aufgabe. Der anfängliche Aufwand ist sehr hoch und zusätzlich muss der gemeinsame Speicher bei Änderungen kontinuierlich automatisch aktualisiert werden.

Abgesehen von diesen Schwierigkeiten trägt die Salesforce-Datenintegration wesentlich dazu bei, eine einheitliche Sicht auf die Daten zu erzielen. Mit einer klaren Integrationsstrategie und dem passenden Datenintegrationstool lassen sich mögliche Hindernisse überwinden.

Checkliste für die Integration

Wie Sie Ihre Daten integrieren, hängt von Ihrem Unternehmen und seinen individuellen Anforderungen und Strategien ab. Bevor Sie beginnen, sollten Sie am besten folgende Schritte beachten:

Identifizieren Sie Ihre Stakeholder

Dazu gehören etwa Salesforce-Experten, Dateningenieure, Kunden und andere Spezialisten mit einem umfassenden Einblick in die Unternehmensdaten.

Erstellen Sie eine Kollaborationsplattform

Wie können Ihre Stakeholder Informationen austauschen und planen?

Identifizieren Sie mögliche Einschränkungen im Hinblick auf Ihre Ressourcen

Was sind die Einschränkungen in puncto Budget, Zeit und Personal?

Identifizieren Sie Ihre technischen Grenzen

Müssen Ihre Daten in Echtzeit verfügbar sein oder können Sie on demand oder stapelweise extrahiert werden?

Entscheiden Sie sich für einen Integrationsansatz

Was funktioniert am besten für Ihr Unternehmen – eine manuelle Konsolidierung, eine Übertragung der Daten in ein Warehouse mittels Anwendungen, eine Übertragung der Daten in ein Warehouse mittels Middleware oder eine Virtualisierung?

Ordnen Sie Felder zu

Ordnen Sie Salesforce-Datenfelder Ihren eigenen Feldern zu.

Wählen Sie die passende Methode

Nutzen Sie für die Integration APIs oder Point-and-click-Methoden?

Wählen Sie ein Tool aus

Nutzen Sie eine Datenintegrationsplattform, um Ihre Integration zu planen, zu vereinfachen und umzusetzen.

Wählen Sie Ihre Salesforce-Integrationsmethode

Für die Salesforce-Datenintegration gibt es keine Universallösung. Bei manchen Methoden kommt ein Data-Warehouse zum Einsatz, andere nutzen keinen gemeinsamen Speicher. Während einige mit manuellen Methoden arbeiten, verwenden andere automatisierte Prozesse. Manche nutzen Anwendungslogik, manche Middleware und wieder andere ETL. Manchmal wird auch ein hybrider Ansatz verfolgt, zum Beispiel automatisierte Datenaktualisierungen in Kombination mit manuellen Prüfungen durch Back-End-Vertriebsteams, um die Gültigkeit der Daten zu bestätigen.

Welche Lösung sich am besten eignet, hängt letzten Endes von vielen Faktoren ab: von der Bereitschaft, ein Data-Warehouse zu erstellen, der Verfügbarkeit von Ressourcen wie Zeit und Geld, der Größe der Datensätze, ob Daten in Echtzeit verfügbar sein müssen usw.

Vereinfachen Sie Ihre Integration

Datenintegrationstools automatisieren die Konsolidierung von Daten aus mehreren lokalen und cloudbasierten Quellen und vereinfachen so den Integrationsprozess. Solche Tools sorgen nicht nur für schnellere ETL-Prozesse, sondern versorgen den zentralen Datenspeicher kontinuierlich mit Echtzeit-Updates. Benutzer müssen kaum oder gar nicht mehr eingreifen. Dies reduziert mögliche Fehler, spart Zeit und steigert somit Produktivität und Datenqualität.

Darüber hinaus ermöglichen solche Tools eine einfachere Skalierung, wenn mehr Datenquellen hinzugefügt werden. Anstatt eines fragmentierten Ansatzes, der für jede Quelle eine andere Integrationsmethode nutzt, bietet ein solches Tool eine durch und durch einheitliche Lösung. Zudem können verschiedene Stakeholder über ein gemeinsames Framework effektiv miteinander kommunizieren.

Die passende Salesforce-Datenlösung

Die Datenintegration ist ein dynamischer Bereich, der ständig im Wandel ist. Neue Anwendungen kommen auf den Markt, Geschäftsanforderungen ändern sich und Stakeholder definieren ihre Prioritäten neu. Das eigentliche Ziel bleibt dennoch dasselbe: Daten effektiv zu integrieren, um mithilfe ausgefeilter Business-Intelligence-Prozesse das Maximum aus den Daten herauszuholen.

Talend Open Studio for Data Integration ist ein Open-Source-ETL-Tool, das Salesforce-Daten mit Ihrem bestehenden Data-Warehouse integriert und Daten zwischen den Systemen synchronisiert. Die einheitliche Eclipse-IDE bietet Datenintegrationsfeatures wie Mapping, Aggregation, Sortieren, Anreicherung und Zusammenführung von Daten und stellt die nötigen Tools zur Verfügung, um Datenintegrationsjobs zu erstellen und zu implementieren – und zwar zehnmal schneller als bei der Handcodierung.

Überlassen Sie bei Ihrer Salesforce-Migration nichts dem Zufall. Laden Sie eine kostenlose Testversion herunter und sehen Sie selbst, welche Möglichkeiten Ihre Salesforce-Daten bieten.

| Zuletzt aktualisiert: August 12th, 2019