Was ist Datenbankintegration?

Bei der Datenbankintegration werden Informationen aus mehreren Quellen – wie soziale Medien, IoT-Sensordaten, Data Warehouses, Kundentransaktionen, etc. – aggregiert und eine aktuelle, saubere Version der gesamten Organisation bereitgestellt. Es handelt sich dabei um den operativen Kern von Big Data. Die Datenbankintegration stellt eine zentrale Stelle zur Verfügung, zu und von der alle geteilten Informationen fließen.

Diagramm Datenbankintegration

Wenn sich beispielsweise zwei Unternehmen zusammenschließen, enthalten ihre zuvor eigenständigen Datenbanken Informationen, die wichtig für die neue, fusionierte Organisation sind. Die Datenbankintegration sorgt dafür, dass Daten dedupliziert, nach festgelegten Regeln gespeichert, bereinigt und allen Stakeholdern auf sichere Art und Weise bereitgestellt werden.

In den letzten Jahren hat sich die Cloud zum neuen Standard für Geschäftsprozesse entwickelt. Gleichzeitig unterstützen Big Data Unternehmen weiterhin dabei, ihre Wettbewerbsfähigkeit in einem zunehmend dynamischen digitalen Markt zu steigern und wertvolle Business Insights zu gewinnen. In diesem Umfeld sorgt die Datenbankintegration dafür, dass Unternehmen ihre Daten effizient nutzen können, statt von der wachsenden Datenflut überrannt zu werden.

Watch The Rise of Cloud Integration Platforms now.
Jetzt ansehen

Vorteile der Datenbankintegration

Daten sind die Grundlage moderner Unternehmen, deren lokale Standorte und physische Infrastrukturen wie Server, Router, etc. durch digitale Interaktionen ersetzt werden.

Richtig eingesetzt wandeln Datenbankprozesse diese Herausforderungen in messbar optimierte Geschäftsprozesse um:

  • Überall zuverlässige Geschäftsdaten – Durch Erfassen, Bereinigen, Sichern und erneutes Bereitstellen von Daten aus einer unbegrenzten Anzahl heterogener Quellen können selbst global agierende Organisationen eine einzige Quelle der Wahrheit schaffen.
  • Ganzheitlicher Prozessüberblick – Die Verwaltung unternehmensweiter Daten über eine zentrale Konsole ermöglicht die Erkennung von Engpässen, verbessert Benutzererfahrung und Kundenservice, verkürzt Lieferzyklen, etc.
  • Vereinfachte Sicherheit – In einer Zeit, in der spektakuläre Hacks die Medien dominieren, wissen Unternehmen, dass sie es mit größeren Sicherheitsbedrohungen und mehr Zugangspunkten zu tun haben, als dies in isolierten lokalen Netzwerkumgebungen jemals der Fall war. Bei einer zentralen Datenbankintegration kommen die finalen Datenversionen aus einer einzigen Quelle und fließen auch dort wieder hin. Das macht es erheblich einfacher, kritische Informationen zu schützen.
  • Einfachere Compliance – Moderne digitale Unternehmen müssen immer öfter nationale und internationale Vorschriften wie HIPAA, PCI und die DSGVO einhalten. Die Datenbankintegration ermöglicht eine zentrale Verwaltung, um die unternehmensweite Compliance sicherzustellen.

Organisationen nutzen die Datenbankintegration auf diese und andere Arten als Fundament für ihre Datenintegrationsplattform und um Rohdaten in wertvolle Erkenntnisse zu verwandeln.

Datenbankintegration in einer modernen IT-Umgebung

Die Zeiten, in denen Organisationen „vom Serverraum“ aus geführt wurden, sind noch nicht ganz vorbei – doch die Cloud-Technologie ist für die nächste Welle der Datenbankintegration gerüstet.

Welche Art der Implementierung eine Organisation wählt, hängt in erster Linie von den bestehenden Geschäftsprozessen ab. Ein Unternehmen mit einem älteren lokalen Datencenter zum Beispiel entscheidet sich wahrscheinlich eher für eine lokale Datenbankintegrationslösung, um den Bedarf an neuen Tools möglichst niedrig zu halten. Jüngere Unternehmen dagegen nutzen häufig Cloud-native Umgebungen mit effizienten Preisstrukturen, unbegrenzter Skalierbarkeit und keinen Vorabkosten für Hardware. Für Unternehmen irgendwo dazwischen schließen Hybrid-Ansätze die Lücke zwischen älteren lokalen Architekturen und der Cloud.

Lokale Datenbankintegration

Die lokale Datenbankintegration unterstützt klassische Netzwerkinfrastrukturen vor Ort. Häufig als eigenständige Produkte verkauft, lassen sich On-Premise-Lösungen lokal installieren und interagieren mit bestehender Hardware und Datenbanken, um BI-Daten zu bereinigen, zu überwachen und zu transformieren.

Da bei On-Premise-Lösungen alle Datenoperationen lokal erfolgen, entlasten sie das Netzwerk. Darüber hinaus ist es das Ziel, dass sie out of the box mit vorgefertigten Konnektoren funktionieren, um eine Verknüpfung mit gängigen Datenquellen zu ermöglichen. Normalerweise sind Kooperationsverträge mit Entwicklern gängiger Produktlinien erforderlich, um die Anbindung regelmäßig zu aktualisieren und zu schützen.

Cloud-Datenbankintegration

Cloud-Datenbankintegrationslösungen sind Cloud-nativ und werden als Teil einer Infrastruktur ausgeführt. Dabei interagieren sie im Hintergrund während sämtliche Datentransaktionen im Unternehmen ablaufen.

Bei diesem Ansatz kommen die bekannten Vorteile der Cloud-Architektur wie Autoskalierung und Pay-per-Usage-Preismodelle zum Tragen. Ein weiterer wichtiger Pluspunkt der Cloud-Datenbankintegration ist die beinahe nahtlose Einbindung, mit der die SaaS-Lösung nicht nur mit anderen Datenbanken in der Umgebung, sondern auch mit der virtuellen Infrastruktur und Sicherheit interagiert und so Echtzeit-Einblicke in sämtliche Prozesse bietet.

Hybride Datenbankintegration

Durch die Kombination von On-Premise- und Cloud-Elementen nutzt ein hybrider Ansatz bei der Datenbankintegration Cloud-basierte SaaS, die Daten zwischen lokalen und remote gehosteten Ressourcen synchronisiert und verwaltet.

Gute Datenbankintegrationslösungen korrelieren und bereinigen Cloud-basierte und lokale Daten und bieten so einen einheitlichen Datensatz innerhalb einer gemischten Umgebung. Die besten Lösungen interagieren nahtlos mit anderen SaaS-Lösungen und bieten eine einfache Benutzeroberfläche, die Entscheidern eine 360-Grad-Sicht aller Prozesse und Interaktionen liefert.

Welchen Ansatz Unternehmen auch immer wählen – sorgfältige Planung, starke Partnerschaften und die richtigen Tools machen den Unterschied zwischen langsamen Netzwerken und Echtzeit-Business Intelligence.

Tools für Datenbankintegration

Die Cloud selbst hat ihren Ursprung in kollaborativen Open Source-Datentechnologien. Letztendlich sorgen sie dafür, dass Verarbeitung, Datenmanagement und die verteilten Speichersysteme zugänglich und erschwinglich bleiben. Viele dieser häufig in Cloud- oder Hybrid-Computinglösungen eingesetzten Kernkomponenten basieren auf Open Source-Technologien.

Es gibt wahrscheinlich keine Organisation, die sich mehr für das Wachstum der Cloud einsetzt als das Apache Software Project. Viele Projekte, die von seiner Community entwickelt wurden, bilden die Grundlage der weltweit größten Big Data-Unternehmen wie Netflix, GitHub und die Europäische Organisation für Kernforschung (CERN).

Open Source-Software

Vor allem diese drei Apache-Tools gehören zu den wichtigsten Datenbankintegrationstools:

  1. Apache Hadoop – Hadoop ist ein Framework für die dezentrale Verarbeitung von Daten, mit dem sich mehrere Petabytes an Informationen unter einer unbegrenzten Anzahl physischer oder virtueller Server aufteilen, im Bulk verarbeiten und dann als saubere, zuverlässige Daten ausgeben lassen.

    Hadoop basiert auf der Programmiersprache Java und verfügt als Open Source-Plattform über Erweiterungs- und Mod-Bibliotheken für die unterschiedlichsten Geschäftsanforderungen. Hadoop bietet ein natives Dateimanagementsystem sowie lineare Skalierbarkeit und Failoverschutz, sodass der Ausfall eines Datenstroms von parallelen Knoten kompensiert wird.

  2. Apache Spark – Spark wird manchmal als neuerer Ersatz für Hadoop angesehen. Tatsächlich handelt es sich eher um eine Ergänzung. Spark verarbeitet Daten bis zu 100 Mal schneller und verbessert so das als MapReduce bekannte Framework für die verteilte Verarbeitung in Hadoop.

    Dies ist möglich, weil Spark die meisten Aufgaben gleich im Speicher verarbeitet, statt die Daten zur Konvertierung an einen physischen oder virtuellen Ort zu übertragen. Doch das, was Spark an Geschwindigkeit bietet, wird durch seine Funktionalität etwas eingeschränkt, da Spark über kein eigenes Dateiverwaltungssystem verfügt. Spark lässt sich mit anderen Dateimanagementsystemen integrieren und arbeitet nahtlos mit seiner Hadoop-Schwester zusammen.

  3. Apache Cassandra – Der Ursprung von Big Data liegt wahrscheinlich in den NoSql-Datenbanken. Sie hoben die Einschränkungen spaltenbasierter und relationaler Datenbanken auf, unterstützten heterogene Speichertypen und ermöglichten auf diese Weise die Datenbankintegration zwischen Dateiformaten wie Text, Bild, Multimedia, etc.

    Cassandra ist Open Source-basiert, unbegrenzt skalierbar und erfüllt selbst die Anforderungen riesiger Organisationen wie Apple, die Cassandra als verteiltes Framework für die Integration von über 10 Petabytes an Daten nutzen.

Download O’Reilly Report: Moving Hadoop to the Cloud now.
HERUNTERLADEN

Die Auswahl des richtigen Datenbankintegrationspartners

Eine Herausforderung bei der Integration ist der Bedarf an benutzerdefinierter Kodierung, um Konnektoren und SaaS-Abhängigkeiten von Apache-Frameworks (o. ä.) zu integrieren. Die Wahl der richtigen Schnittstellentools aus den verschiedenen Open Source-Plattformen ist besonders wichtig, da die Programmierung von Hand die Geschäftsprozesse verlangsamen oder behindern kann.

Die besten Datenbankintegrationstools vereinfachen das Schreiben von benutzerdefiniertem Code und sparen IT-Teams so unglaublich viel Zeit. Anstelle von häufigen, manuell programmierten Patches, mit denen Konnektoren im Rahmen von Updates und Sicherheitsprüfungen am Laufen gehalten werden, verarbeiten leistungsstarke aber einfache GUI-Tools Datenintegrationsaufgaben bis zu 10 Mal schneller – und zu ca. einem Fünftel der Kosten von handkodierten Jobs.

Der richtige Integrationsansatz bietet die Flexibilität kostenloser Open Source-Lizenzierungsoptionen mit denen Entwickler Apache Hadoop, NoSQL-Datenbanken und andere Big Data-Tools kennenlernen und testen können.

Für Organisationen, denen es an internem Know-how oder an der nötigen Infrastruktur zum Managen der Datenbankintegration fehlt, können auch auf ganzheitliche Partnerlösungen zurückgreifen. Hier bietet sich z. B. eine hervorragend bewertete Integration-Platform-as-a-Service (iPaaS) an, die alle Aspekte des Big Data-Flows managt und Umgebungen in interaktive BI-Systeme verwandelt.

Sind Sie bereit, Ihre Datenbankintegration zu verbessern?

Werfen Sie zuerst einen Blick auf Ihre aktuelle Datenbank und entscheiden Sie dann, welche Plattform für Ihre Integrationsanforderungen am besten passt. Machen Sie sich darüber Gedanken, ob Sie bei einer lokalen Lösung bleiben wollen, oder ob Ihr Unternehmen bereit für die Cloud ist.

Wie wäre es mit einer kostenlosen Testversion von Talend Cloud? Damit können Sie Ihre aktuelle Datenbankintegration verbessern oder ein komplett neues Projekt starten und dabei von einer umfassenden visuellen Kontrolle über ETL, ELT und weiteren Datenintegrationsaufgaben profitieren.

| Zuletzt aktualisiert: October 25th, 2018