Datenvorbereitung: Empowerment für den Geschäftsbenutzer


 

Immer mehr Geschäftsbenutzer mit begrenzten Programmierkenntnissen interessieren sich für Integrationsfunktionen und Datenqualität, während Unternehmen immer stärker „datenbesttimmt“ werden. Vom Marketing bis zu Logistik, Kundendienst, leitendem Management, Personalwesen und Finanzen gilt: Die Datenanalyse hat sich zu einem Mittel für die Verbesserung der Prozessproduktivität und Effizienz für alle Unternehmensabteilungen entwickelt. Selbst mit Cloud-Grafikentwicklungsfunktionen, wie sie von Publishern wie Talend angeboten werden, bleiben diese Tools aber in erster Linie Informatikern und Spezialisten für die Entwicklung von Datenintegrationsaufgaben vorbehalten.

Ein Marketingmanager, der beispielsweise heute eine Kampagne starten will, muss sich an seine IT-Abteilung wenden, um spezifisch ausgerichtete und segmentierte Daten zu erhalten. Der Marketingmanager muss Zeit für die detaillierte Beschreibung seiner Anforderungen aufwenden, und die IT-Abteilung ihrerseits muss sich die Zeit für die Projektentwicklung nehmen. Marketingmanager und IT-Abteilung müssen dann gemeinsam erste Tests durchführen, um die Relevanz der Entwicklung zu bestätigen. Da heute Reaktionszeit alles ist und ein globaler Konkurrenzkampf geführt wird, bei dem Echtzeit immer mehr zur Norm wird, ist dieser Prozess keine gültige Option mehr.

Dennoch haben Geschäftsmanager schlicht und einfach keine Zeit zu verschwenden und benötigen gemeinsame Selbstbedienungs-Tools, um ihre Ziele zu verwirklichen. Die weit verbreitete Nutzung von Excel ist ein Beleg dafür. Geschäftsbenutzer sorgen so gut wie möglich dafür, dass ihre Daten verwendbar sind. Das heißt, sie verbringen 70 bis 80 % ihrer Zeit mit der Vorbereitung dieser Daten, ohne dass die Datenqualität gewährleistet ist. Darüber hinaus stellt der Mangel an zentraler Governance ein Risiko hinsichtlich der Nutzung der Daten dar. Dies umfasst Datenschutz- und Compliance-Fragen und selbst Probleme mit der Datennutzung selbst (z. B. Lizenzierungsprobleme).

Dies sind weit verbreitete Einschränkungen, und Benutzer benötigen spezifische Tools, um Enrichtment-, Qualitäts- oder Problemerfassungsprobleme zu beheben. Diese neue Art einer Datenvorbereitungslösung ist für Geschäftsbenutzer vorgesehen; es muss auf einer gemeinsamen Oberfläche des Excel-Typs basieren und ein breites Spektrum an Datenqualitätsfunktionen umfassen. Darüber hinaus muss sie Anzeige- und natürlich Umwandlungsfunktionen beinhalten, die einfacher zu verwenden sind als Excel-Makros und für die am meisten verwendeten Domänen spezialisiert sind, um die Annahme durch die Geschäftsbenutzer zu sichern.

Durch eine semantische Erkennungsfunktion könnte die Lösung z. B. eine automatische Modellerfassung und -kategorisierung ermöglichen, während gleichzeitig fehlende oder nicht konforme Werte angezeigt werden. Durch einen auf Farbcodes und Piktogrammen basierenden visuellen Darstellungsmodus kann der Benutzer seine Daten besser verstehen. Darüber hinaus erleichtert eine automatische Datenklassenerkennungsfunktion (persönliche Informationen, Sozialversicherungsnummer oder Kreditkarte, URL, E-Mail usw.) die Aufgaben des Benutzers zusätzlich.

Wenn das Unternehmen mit der Bereitstellung von Selbstbedienungs-Tools zufrieden ist, spricht es aber nur einen Teil der Herausforderungen an und beschäftigt sich nicht mit den Problemen der mangelnden Daten-Governance. Selbst die kompetenteste IT-Abteilung kontrolliert in der Regel die Daten. Dadurch entsteht manchmal ein „Turm von Babel“, wenn die Benutzer ihre eigenen Versionen der Originaldaten extrahieren. Auf diese Weise würde eine Datenbestandsfunktion ermöglichen, die Datensätze von Unternehmen, die per „Selbstbedienung“ geöffnet werden, durch die IT-Abteilung aufstellen oder zertifizieren zu lassen, wobei sie aber direkt von den Geschäftsbenutzern verwaltet werden. Dies würde die Implementierung einer wirklich zentralen Kooperationsplattform ermöglichen, Zugriff auf sichere und zuverlässige Daten gewähren und gleichzeitig die Verbreitung unterschiedlicher Versionen reduzieren.

Darüber hinaus kann diese gemeinsame und zentralisierte Plattform der IT helfen, die Nutzung von Daten mittels Indikatoren wie der Beliebtheit von Datensätzen zu steuern und deren Nutzung zu überwachen. Es können auch Alarme programmiert werden, um Probleme mit der Datenqualität, Compliance oder dem Datenschutz so schnell wie möglich zu identifizieren. Rückverfolgung ist der erste Schritt in jedem guten Governance-Plan. Insgesamt ist dies eine Win-Win-Situation für alle Beteiligten: Der Geschäftsbenutzer ist froh, Zugriff auf Selbstbedienungs-Datensätze zu haben, selbstständig und agil hinsichtlich der Durchführung der für sein Geschäft erforderlichen Datenumwandlungen zu handeln, und die IT-Abteilung delegiert Aufgaben gleichzeitig besser an ihre Benutzer, während gleichzeitig für gute Daten-Governance-Bedingungen gesorgt wird.

Ein neues Risiko des „Selbstbedienungsmodells“ ist jedoch die Tatsache, dass es eine neue Art der Datenexplosion fördert: die von Personalvorbereitungsskripten. In der Realität können viele Vorbereitungsschritte wie wiederkehrende Vorgänge, die monatlich oder vierteljährlich durchgeführt werden, beispielsweise das Abschließen der Bücher, automatisiert werden. Das bezeichnen wir als „Operationalisierung“: Die IT-Abteilung startet die Ausführung der Vorbereitung wiederkehrender Daten, die in Form eines verifizierten, zertifizieren und offiziellen Informationsstroms abgerufen werden können. Durch die Operationalisierung ihrer Vorbereitungen können die Benutzer Informationssystem-Zuverlässigkeitsgarantien nutzen, und zwar auch für sehr große Volumen, und das dank Hadoop zu einem Bruchteil der Kosten. Letztendlich trifft dieser positive Kreislauf auf das zweischneidige Schwert der Anforderungen von Unternehmen: die Reaktivität (oder gar Proaktivität) der Geschäftsbenutzer, die Entscheidungen in immer kürzerer Zeit treffen müssen, und der Bedarf an Governance und Zentralisierung der IT-Abteilung.

Related Resources

5 Ways to Become A Data Integration Hero

Products Mentioned

Talend Data Quality

 

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Du kannst diese HTML Tags und Attribute benutzen:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>