Big Data Platform

Verwandeln Sie Big Data in verlässliche Erkenntnisse.

Starten Sie mit dem führenden Open-Source-Big-Data-Tool durch

Talend Big Data Platform vereinfacht komplexe Integrationen, sodass Sie Apache Spark, Databricks, Qubole, AWS, Microsoft Azure, Snowflake, Google Cloud Platform und NoSQL effizient nutzen können. Dank integrierter Datenqualität kann Ihr Unternehmen aus Big Data verlässliche Erkenntnisse gewinnen. Nutzen Sie alle Vorteile und die hohe Skalierbarkeit Ihres Big-Data-Frameworks mit der führenden Datenintegrations- und Datenqualitätsplattform auf Basis von Spark für cloudbasierte, hybride und Multi-Cloud-Architekturen.

Integrate data sources and run on the leading data platforms

Big Data Platform Funktionen

Lizenz und Support

  • Subskriptionslizenz mit Garantie und Haftungsausschluss
  • 2 kostenlose Data Preparation-Lizenzen und 2 kostenlose Data Stewardship-Lizenzen mit jeder beliebigen Talend-Subskription
  • Verfügbar als Cloud-Service und Software-Download
+ Mehr anzeigen

Design- und Produktivitätstools

  • Generiert nativen MapReduce- und Spark-Batch-Code
  • Grafisches Mapping für komplexe JSON-, XML- und EDI-Daten auf Spark
  • Spark- und MapReduce-Job-Designer
  • Serverlose Spark-Verarbeitung durch Databricks und Qubole
  • Dynamische Distributionsunterstützung
  • Hadoop-Job-Scheduler mit YARN
  • Kerberos für Hadoop-Sicherheit
  • Aufnahme, Laden und Entladen von Daten in einen Data-Lake
  • Grafische Designumgebung
  • Teamarbeit durch gemeinsames Repository
  • Continuous Integration/Continuous Delivery
  • Grafisches Mapping für komplexe JSON, XML- und EDI-Daten
  • Audit, Jobvergleich, Wirkungsanalyse, Testen, Debugging und Tunen
  • Metadata-Bridge für Metadatenimport/-export und zentrales Metadatenmanagement
  • Distant Run und Parallelisierung
  • Dynamisches Schema, wiederverwendbare Joblets und Referenzprojekte
  • Repository-Manager
  • ETL- und ELT-Unterstützung
  • Wizards und interaktiver Data-Viewer
  • Versionierung
  • Change Data Capture (CDC)
  • Automatische Dokumentation
  • Personalisierbare Bewertung
  • Musterbibliothek
  • Cloud Pipeline Designer
+ Mehr anzeigen

Datenqualität, Selfservice und Governance

  • Datenprofiling und -analysen mit grafischen Darstellungen und aufgeschlüsselten Daten
  • Automated data standardization, cleansing, and rules enforcement
  • Data privacy with masking and encryption
  • Datenqualitätsportal mit Überwachung, Reporting und Dashboards
  • Semantische Erkennung mit automatischer Mustererkennung
  • Umfassendes Survivorship
  • Data-Sampling
  • Anreicherung, Harmonisierung, Fuzzy Matching und Deduplizierung
  • Facettensuche, Data Sampling, semantische Analyse, Kategorisierung und automatisches Profiling
  • Social curation with data sharing, ratings and endorsement
  • Cross reference between datasets and data pipelines for data lineage and impact analysis
  • Cross reference between datasets and data preparations for data lineage and impact analysis
+ Mehr anzeigen

Konnektoren

  • Cloud: Amazon Web Services (AWS), Microsoft Azure, Google Cloud Platform und weitere
  • Cloud Data Warehouse and Data Lakes: Snowflake, Amazon Redshift, Azure Data Lake Storage Gen2, Azure SQL Data Warehouse, Databricks Delta Lake, Google BigQuery
  • Unterstützte Big-Data-Distributionen: Amazon EMR, Azure HDInsight, Cloudera, Google Dataproc, Hortonworks, MapR
  • Serverless: Cloudera Altus, Databricks, Qubole
  • Spark MLlib (Klassifizierung, Clustering, Empfehlung, Regression)
  • NoSQL: Cassandra, Couchbase, DynamoDB, MongoDB, Neo4j und weitere
  • RDBMS: Oracle, Teradata, Microsoft SQL Server und weitere
  • SaaS: Marketo, Salesforce, NetSuite und weitere
  • Anwendungspakete: SAP, Microsoft Dynamics, Sugar CRM und weitere
  • Technologien: Dropbox, Box, SMTP, FTP/SFTP, LDAP und weitere
  • Optionale Adressvalidierungsservices von Fremdanbietern
+ Mehr anzeigen

Komponenten

  • Hadoop-Komponenten: HDFS, HBase, Hive, Pig, Sqoop
  • Dateiverwaltung: Öffnen, Bewegen, Komprimieren, Entpacken ohne Skripten
  • Steuerung und Orchestrierung von Datenströmen und Datenintegrationen mit Masterjobs
  • Mappen, Aggregieren, Sortieren, Anreichern und Zusammenführen von Daten
+ Mehr anzeigen

Datenaufbereitung und Data-Stewardship

  • 2 kostenlose Lizenzen mit einer Subskription
  • Importieren, Exportieren und Kombinieren von CSV-, Parquet- und AVRO-Dateien
  • Tableau-Export
  • Selfservice-on-Demand-Zugriff auf autorisierte Datensätze
  • Gemeinsame Nutzung von Datenaufbereitungen und Datensätzen
  • Operationalisierung von Aufbereitungen in beliebigen Daten- oder Big-Data-Integrationsflows
  • Ausführung von Aufbereitungsaufgaben auf Apache Beam*
  • Automatische Erkennung, Standardisierung, automatisches Profiling, intelligente Vorschläge und Datenvisualisierung
  • Personalisierung von Semantiktypen für automatisches Profiling und Standardisierung
  • Intelligentes und selektives Sampling sowie vollständige Durchläufe
  • Nachverfolgung und Maskierung von Daten mit rollenbasierter Sicherheit
  • Bereinigungs- und Anreicherungsfunktionen
  • Data-Stewardship-App für Datenkuratierung und -zertifizierung
  • Definition von Datenmodellen, Datensemantik und Profildaten Define and apply rules
  • Zusammenführung und Abgleich von Daten, Behebung von Datenfehlern und Datenarbitrierung (Klassifizierung und Zertifizierung)
  • Orchestrierung und Zusammenarbeit bei Kampagnenaktivitäten
  • Definition von Benutzerrollen, Workflows und Prioritäten, Zuweisung und Verteilung von Aufgaben, Kennzeichnung und Kommentare
  • Einbettung von Governance- und Stewardship-Funktionen in Datenintegrationsflows und Verwaltung abgelehnter Transaktionen
  • Einbettung von Zertifizierung und Fehlerbehebung durch Fachkräfte in MDM-Prozesse
  • Abgleichentscheidungen, die nicht automatisch verarbeitet werden können
  • Skalierbare Datendeduplizierung mit maschinellem Lernen
  • Audit und Nachverfolgung von Maßnahmen zur Behebung von Datenfehlern. Überwachung des Kampagnenfortschritts. Rückgängigmachen/Wiederherstellen auf Basis von Geschäftsanforderungen
+ Mehr anzeigen

Verwaltung und Monitoring

  • Hochverfügbarkeit, Lastverteilung, Failover für Jobs
  • Deployment-Manager und Team-Zusammenarbeit
  • Verwaltung von Benutzern, Gruppen, Rollen, Projekten und Lizenzen
  • Verwaltung von Ausführungsengines
  • Single Sign-On (SSO) integration with several SSO providers
  • Ausführungsplan, zeit- und ereignisgesteuerter Scheduler für Jobs
  • Prüfpunkte, Fehlerbehebung
  • Kontextmanagement (Entw., QS, Prod.)
  • Erfassung und Anzeige von Protokollen
  • Optionales Admin-Benutzer-Add-on*
  • Engine-Cluster für Jobs
  • Statische IP-Adressen*
  • Protokollhistorie zur Jobausführung (2 Monate für Einstiegsprodukte, 3 Monate für Plattformen)
  • Umgebungen (2 für Einstiegsprodukte, unbegrenzt für Plattformen)*
  • Cloud Security Information and Event Management (SIEM), Intrusion Detection System (IDS), Intrusion Prevention System (IPS) and Web Application Firewall (WAF)
+ Mehr anzeigen

Big-Data-Qualität

  • Datenbereinigung, -profiling, -maskierung, -abgleich und Parsing auf Spark und Hadoop
  • Maschinelles Lernen für Datenabgleich und Deduplizierung
  • Unterstützung für Cloudera Navigator und Apache Atlas
  • HDFS-Datei-Profiling
+ Mehr anzeigen

Erweitertes Data-Profiling

  • Betrugsmustererkennung mithilfe des Benfordschen Gesetzes
  • Erweiterte Statistiken mit Indikatorschwellenwerten
  • Spaltensatzanalyse
  • Erweiterte Vergleichsanalyse
  • Zeitspalten-Korrelationsanalyse
+ Mehr anzeigen

Datenintegration passend zum Budget

Talend keeps it flexible

Flexibel

Mit einem Jahres- oder Monatsabonnement halten Sie die Kosten unter Kontrolle und bleiben flexibel bei der Ressourcennutzung.

Talend keeps it predictable

Vorhersehbar

Talend rechnet pro Nutzer ab, nicht nach Datenvolumen oder Konnektoren.

Talend keeps it simple

Einfach

50 % niedrigere Gesamtbetriebskosten mit einer zentralen Lösung in der Cloud.

Dank Talend konnten wir die Panama Papers entschlüsseln, Zusammenhänge herstellen und die Personen hinter den geheimen Offshore-Firmen sichtbar machen.

Mar Cabra, Leiter der Data & Research Unit
Talend customer: Euronext

An der Börse kommt es auf drei Dinge an: Integrität (weil man keine einzige Order verlieren darf), permanente Verfügbarkeit und Governance (in einem streng regulierten Markt besonders wichtig). Talend hat diese Anforderungen brillant erfüllt.

Abderrahmane Belarfaoui, Chief Data Officer (CDO), Euronext

With Talend, we have improved our 48.8 million passenger’s experience and operation’s efficiency. And we have been recognized as Europe ‘s number One airport over 40 million passengers according to ACI World’s globally-established Airport Service Quality programme

Pietro Caminiti - Head of IT Solutions, Aeroporti di Roma

Sind Sie bereit, mit Talend loszulegen?