Bei Big Data ist Geschwindigkeit das A und O

article in Englisharticle in French

Big-Data-Benchmarking-Test: Talend und Informatica im Vergleich

Wenn Sie je ein Gespräch mit einem unserer Berater geführt oder Marketingunterlagen meines Teams gelesen haben, wissen Sie bereits, dass wir damit werben, dass Talend bei Big Data erhebliche Geschwindigkeitsvorteile gegenüber der Konkurrenz bietet.

Hier sehen Sie zum Beispiel eine Folie, die Teil unseres Mediensets für Talend 6 war.

Das lässt sich leicht als bloßes Marketing abtun, daher war es mir wichtig, die Aussage mit handfesten Daten zu untermauern.Dazu haben wir bei MCG Global Serviceseinem führenden Anbieter von Informationsmanagementdiensten, Benchmark-Tests in Auftrag gegeben, bei denen die Talend Big Data Integration mit Informatica Big Data Edition verglichen wird.

MCG hat sowohl bei den Benchmark-Tests als auch beim Ausarbeiten von Anwendungsfällen und Fragen, die für viele Organisationen hochgradig relevant wären, hervorragende Arbeit geleistet.

Unter anderem wurden die folgenden Fragen gestellt:

- Welche Auswirkungen haben Seiten- und Produktaufrufe auf unserer Website auf den Umsatz? Wie viele Seitenaufrufe erfolgen vor der Kaufentscheidung (online oder im Geschäft)? (Anwendungsfall 1)

- Wie wirken sich unsere Gutscheinkampagnen auf Produktumsatz und Servicenutzung aus? Besuchen Kunden nach Ansicht oder Erhalt unserer Gutscheinwerbung unsere Website? Kaufen sie mehr Produkte oder zusätzliche Produkte, die sie ohne Gutschein nicht kaufen würden? (Anwendungsfall 2)

Wie stark beeinflusst bzw. fördert unsere Empfehlungs-Engine den Produktabsatz? Neigen Kunden dazu, aufgrund dieser Empfehlungen zusätzliche Produkte zu kaufen? (Anwendungsfall 3)

Wie Sie unten sehen werden, bestätigt der Benchmark-Test den Geschwindigkeitsvorteil, mit dem wir werben.Wenn Sie einen detaillierteren Überblick über die Bedingungen und Ergebnisse des Benchmark-Tests erhalten möchten, können Sie den vollständigen Bericht hier herunterladen.

 

Hier sehen Sie einen Überblick über den Gesamtvorteil mit Talend und erkennen, wie dieser mit zunehmendem Datenvolumen ansteigt.

Beim Vergleich von Talend und Informatica lässt sich relativ einfach erklären, weshalb der Abstand so enorm ist. Dank der In-Memory-Kapazitäten von Apache Spark können Talend-Nutzer Datasets einfach schneller einbinden. Spark verwendet schnelle Remote Procedure Calls für eine effiziente Verteilung und Planung der Aufgaben. Darüber hinaus nutzt es die Vorteile eines Thread Pools für die Ausführung von Aufgaben anstelle eines Pools von Java Virtual Machine-Prozessen. So kann Spark Aufgaben in Millisekunden planen und ausführen, während die MapReduce-Planung mehrere Sekunden und – bei stark belegten Clustern – sogar Minuten dauern kann.

Informatica Big Data Edition bietet keine direkte Spark-Unterstützung. Hier hängt es von der Hadoop-Engine und deren Konfiguration ab, wie sich Hive-on-Spark verhält und was es leistet.

Zur Erinnerung: Wenn Sie Näheres über die Benchmark-Tests erfahren möchten, können Sie den vollständigen Bericht hier herunterladen.

Share

Leave a comment

Neuen Kommentar schreiben

More information?