Vollständige Ressourcenbibliothek

Besser Fußball spielen mit Big Data

Der Begriff „Internet of Things“ (oder kurz IoT) beschreibt die Vernetzung von “intelligenten Gegenständen” zu Analyse-Zwecken, um damit Menschen bei schwierigen Entscheidungen zu unterstützen.

Jetzt ansehen

5 Möglichkeiten, um Ihre Big Data zu optimieren

Angesichts der wachsenden Menge an Big Data sollten Unternehmen ihre Prozesse optimieren. Big Data zu optimieren bedeutet zum Beispiel, (1) Latenz bei der Verarbeitung zu vermeiden, (2) Daten in Echtzeit zu nutzen und (3) Daten zuerst zu analysieren und erst dann Entscheidungen zu treffen. Erfahren Sie alles, was Sie wissen müssen, um heute noch loszulegen.

Weitere Informationen

Aufbau eines verwalteten Data Lake in der Cloud

Der Zweck eines Data Lake liegt im Wesentlichen darin, einen direkten und umfassenden Zugriff auf rohe (ungefilterte) Unternehmensdaten bereitzustellen. Data Lakes sind eine Alternative zur Speicherung einer begrenzten Anzahl unterschiedlicher Datensätze in verteilten, heterogenen Datensilos.

Weitere Informationen

Erstellung von Metadaten für die Verknüpfung von Clustern aus Konfigurationsdateien

In diesem Tutorial erfahren Sie, wie Sie Hadoop-Cluster-Metadaten erstellen, indem Sie die Konfiguration aus den Hadoop-Konfigurationsdateien importieren.Dieses Tutorial basiert auf Talend Data Fabric Studio Version 6 und einem Hadoop-Cluster: Cloudera CDH Version 5.4.1. Erstellen Sie eine neue Hadoop-Cluster-Metadaten-DefinitionWählen Sie die Ansicht Integration aus.Erweitern Sie im Project Repository den Bereich Metadata, klicken Sie mit der rechten Maustaste auf Hadoop Cluster und klicken Sie anschließend auf Create Hadoop Cluster, um den Assistenten zu öffnen.Geben Sie im „Hadoop Cluster Connection“-Assistenten im Feld „Name“ MyHadoopCluster_files ein. Geben Sie im Feld „Purpose“ Cluster connection metadata ein. Geben Sie im Feld „Description“ Metadata to connect to a Cloudera CDH 5.4 cluster ein und klicken Sie auf Next.

Jetzt ansehen

Hadoop Hive

Talend, der Spezialist für Open-Source-Integration, bietet nahtlose Hadoop Hive-Unterstützung in Talend Open Studio for Big Data. Als erste reine Open-Source-Lösung für Big-Data-Management vereinfacht Talend Open Studio for Big Data die Arbeit mit Hadoop Hive und die Integration von Hive in die Datenflüsse Ihres Unternehmens.

Weitere Informationen

Sqoop

Talend, der führende Anbieter von Open-Source-Lösungen für Datenintegration, integriert Sqoop-Funktionen in eine einheitliche, vielfältige und benutzerfreundliche Big-Data-Integrationslösung und steigert so den Nutzen von Sqoop.

Weitere Informationen

Edge Analytics: Die Vor- und Nachteile unmittelbarer, lokaler Erkenntnisse

Laut Gartner werden 90 % der implementierten Data Lakes nutzlos sein und Experian geht davon aus, dass rund 32 % der Daten in US-Unternehmen ungenau sind. Doch Daten sind das wertvollste Gut für jedes Unternehmen und es wäre eine Schande, sie komplett zu löschen oder irgendwo in einem verlassenen Data Lake vor sich hindümpeln zu lassen. Data Scientists sollten ihre wachsenden Pools mit IoT-Daten stattdessen aktiv nutzen, um die von verschiedenen Endpunkten bereitgestellten Informationen zu analysieren und Schlussfolgerungen daraus zu ziehen, die zu besseren Geschäftsergebnissen führen.

Weitere Informationen

Was ist Datenaufbereitung?

Unter Datenaufbereitung versteht man die Bereinigung und Transformation von Rohdaten vor der eigentlichen Verarbeitung und Analyse. Der Prozess ist zwar zeitaufwendig, aber unerlässlich, um die Vorteile von Business-Intelligence zu realisieren. Und dank smarter Selfservice-Tools funktioniert die Datenaufbereitung heute so einfach und effizient wie nie zuvor.

Weitere Informationen

Die Zukunft von Big Data

Big Data ist ein Sammelbegriff für alles, was mit der Erfassung, Analyse und Nutzung riesiger Mengen digitaler Informationen zur Prozessoptimierung zu tun hat. Es verändert die Art wie wir leben, einkaufen und unseren Alltag bewältigen – und das in einem rasanten Tempo. Hier erfahren Sie, was genau sich hinter dem Begriff Big Data verbirgt und wie Sie möglichst viel aus Ihren Big Data herausholen können.

Weitere Informationen

ETL-Tests: Ein Überblick

ETL-Tests beziehen sich auf Prüfungen während des ETL-Prozesses, um die Genauigkeit von Daten zu validieren, zu verifizieren und sicherzustellen sowie Dubletten und Datenverluste zu verhindern. Erfahren Sie mehr über die 8 Phasen von ETL-Tests, 9 Arten von Tests, häufige Herausforderungen, wie Sie das beste Tool finden und mehr.

Weitere Informationen

Was ist ein Data Lake?

Ein Data Lake ist ein zentrales Repository, das Big Data aus verschiedenen Quellen im Rohformat speichert. Aufgrund der Vorteile des Data Lake-Formats verabschieden sich viele Organisationen von ihren Data Warehouses. Erfahren Sie, worin sich Data Lakes von anderen Speichern unterscheiden, warum sie immer beliebter werden und wie Sie anfangen können, einen Data Lake zu erstellen.

Weitere Informationen

Was ist Data-Profiling?

Data-Profiling eröffnet neue Geschäftschancen. Unternehmen, die Data-Profiling für die Organisation und Analyse ihrer Daten nutzen, können ihr Erfolgspotenzial steigern und sich klare Wettbewerbsvorteile sichern.

Weitere Informationen


Seiten werden angezeigt of 3