Monat: March 2018

Datenumzug in die Cloud: Amazon S3

AWS Redshift

Migration in die Cloud 2018 war das Jahr der Cloud. Immer mehr Unternehmen nutzen Cloud-Technologien. Wenn auch Sie dazugehören, brauchen Sie eine klare Vorstellung davon, wie Sie die Cloud am besten einsetzen. Oft ist eines der größten Probleme der Umzug lokaler Datenbestände in den neuen Cloud-Speicher. Ohne die richtigen Tools beißt man sich da schnell […]


Wissenswertes über die Partitionierung mit Apache Spark: eine Einführung

Die Resilient Distributed Datasets (RDD) von Apache Spark sind Sammlungen verschiedenartiger Daten, die so groß sind, dass sie nicht auf einen einzelnen Node passen und deshalb am besten durch Partitionierung auf mehrere Nodes verteilt werden. Apache Spark nimmt die Partitionierung von RDDs und ihre Verteilung auf Nodes automatisch vor. Die RDDs werden “faul“ ausgewertet, d. h., ihre […]