Sechs Dinge, die eine Big-Data-Plattform aufweisen sollte

article in English

Damit Unternehmen wirklich datengesteuert arbeiten können, müssen sie das „Was?“ und „Wie?“ und das „Was wäre, wenn?“ verstehen. Und zwar nicht nur in Bezug auf ihre eigenen Unternehmensdaten (Kurzsicht), sondern auch die Big Data um sie herum (Geodaten, soziale Daten und Sensordaten). Das ist der einzig mögliche Weg für Unternehmen, eine 360-Grad-Sicht auf ihre Kunden, ihre Geschäftstätigkeit und den Markt zu erhalten und zu begreifen, welche Herausforderungen und Chancen dies für ihr Geschäft mit sich bringt.

Eine der größten Herausforderungen von Big Data für Unternehmen ist die Integration mehrerer Datenquellen, um einen aktionsfähigen Einblick zu erhalten. Laut der IDC (International Data Corporation) machen das Erfassen und Aufbereiten von Daten für die Analyse in der Regel 80 Prozent der Gesamtzeit aus, die für ein Analyseprojekt aufgewendet wird. Das ist eine erstaunliche Menge Zeit, die für die Datenvorbereitung verschwendet wird, nur damit Sie gewisse Einblicke daraus gewinnen können. Anders ausgedrückt ist die Datenintegrationssoftware höchstwahrscheinlich DER Schlüssel zum Erfolg für alle Big-Data-Projekte.

Wir haben für Sie sechs einfache Fragen zusammengestellt, die sich jeder stellen sollte, der die effektivste Datenintegrationsplattform für optimale Erkenntnisse aus den Daten implementieren möchte:

  1. Ist die Nutzung intuitiv? Verlangen Sie einen Blick auf die Benutzeroberfläche. Ist diese einfach aufgebaut oder kompliziert? Erfolgt die Codegenerierung in der Anwendung automatisch oder müssen Sie diese manuell ausführen? Können Sie die Aufgaben über Drag&Drop ausführen? Sind Workflow und Benutzeroberfläche der Plattform wie aus einem Guss oder sehen sie eher wie eine bunte Mischung aus verschiedenen Anwendungen aus?
  1. Werden die Daten zusammengeführt? Kann die Plattform alle Arten von Daten (Cloud, stationär, Internet der Dinge usw.) integrieren und können Sie mit ein und derselben Lösung sowohl im Batch arbeiten als auch in Echtzeit?
  1. Wird Hadoop optimal genutzt? Bei einigen Tools müssen die Daten vor dem Laden in Hadoop verarbeitet und umgewandelt werden. Dies führt nicht nur zu einer erheblichen Verlangsamung der Projekte, sondern bedeutet auch, dass Sie die Leistungsfähigkeit von Hadoop nicht optimal nutzen können.
  1. Ist die Plattform auf dem neusten Stand? Arbeitet die Software auf Grundlage von Open Source oder ist es eine proprietäre Software? Open-Source-Lösungen halten erwiesenermaßen besser Schritt mit der hohen Geschwindigkeit bei Big-Data-Innovationen und erlauben Ihnen, flexibel zu bleiben und besser auf die geschäftlichen Anforderungen reagieren zu können.
  1. Ist sie schnell? Nutzt die Plattform für die Datenverarbeitung Spark und Spark-Streaming in Hadoop? Oder gehört sie in die Kategorie YARN (Yet Another Resource Negotiator)?
  1. Ist sie kosteneffektiv? Wie hoch sind die Gesamtkosten für den Erwerb? Sind diese adäquat und auf Grundlage der involvierten Entwickler berechnet? Oder erfolgt die Berechnung nach Datenvolumen, Connectors oder CPUs?

Wir würden gern Ihre Meinung hören: Was ist für Sie die größte Herausforderung bei der Bewältigung von Big Data?

 

Share

Leave a comment

Neuen Kommentar schreiben

More information?