Was verbirgt sich hinter den Begriffen Business Intelligence, Machine Learning oder Data Analytics? Wo können die entsprechenden Methoden in meinem Unternehmen eingesetzt werden?

Business Intelligence and Data Analytics Big Picture

Mit unserem Big Picture Business Intelligence & Data Analytics möchten wir Ihnen dabei helfen, Struktur in Ihren Datenprozess zu bringen, um die Potenziale Ihres Unternehmens leichter zu erkennen. Den Datenprozess unterteilen wir in vier Analytic Stages, deren Stufen aufeinander aufbauen und durch unterschiedliche Ansatzpunkte der Optimierung Ihres Datenhaushalts dienen. Abhängig von der Ausbaustufe in Ihrem Unternehmen sind dabei unterschiedliche Einstiegsmöglichkeiten gegeben.

 

Descriptive Analytics

Im Vordergrund von Descriptive Analytics steht die Beantwortung der Frage: Was ist in der Vergangenheit passiert? Als Grundlage dienen historische Daten, die durch analytische Verfahren zur Steigerung der Datenqualität,  der Datenkonsistenz und des Datenschutzes aufbereitet werden und das Ziel verfolgen, Geschäftsprozesse optimal nutzen zu können. Wir unterscheiden dabei die drei Prozessschritte Manage, Report und Cluster.

Manage

In diesem Prozessschritt werden die relevanten Datenquellen identifiziert. Im anschließenden ETL-Prozess (Extract, Transform, Load) werden die Daten je nach Speichertechnologie aufbereitet und persistiert. Befindet sich der Zielbestand in einem DWH (Data Warehouse) werden die Daten an das vorliegende relationale Datenbankmodel angepasst. Dies gilt nicht für einen Data Lake – in diesem können sowohl strukturierte Daten (z. B. aus relationalen Datenbanken), semi-strukturierte Daten (z. B. CSV), als auch unstrukturierte Daten (z. B. Dokumente, Bilder, Videos) gespeichert werden.

Report

Das Reporting beschäftigt sich mit der Ermittlung, Verarbeitung und Bereitstellung von Informationen über ein Unternehmen in Form von Berichten bzw. Reports. Datenbasis ist häufig ein DWH. Die Berichte können bei Bedarf (Ad-Hoc Reporting) oder auch regelmäßig angefordert und erstellt werden. Eine weitere Darstellungsmöglichkeit sind Dashboards, welche die Daten in einem visuell ansprechenden und leicht verständlichen Format aufbereiten und dadurch die Kommunikation erleichtern. 

Cluster

Mit Clusterverfahren können unklassifizierte historische Daten segmentiert und in ähnliche bzw. gleichartige Gruppen eingeteilt werden – sogenannte Cluster. Unbekannte Datensätze werden in das Cluster mit der größten Übereinstimmung eingeordnet. Somit kann ein experimentelles Entdecken von Ähnlichkeiten, Gemeinsamkeiten oder versteckten Strukturen erfolgen. Wenn die Cluster durch maschinelles Lernen identifiziert werden, spricht man auch von Unsupervised Machine Learning, da die zu bestimmenden Segmente vorher unbekannt sind. Es ist beispielsweise vorstellbar, dass Fotos von Äpfeln und Birnen in die beiden Cluster „rote Objekte“ und „grüne Objekte“ eingeordnet werden, anstatt die entsprechende Frucht zu identifizieren.

Cluster 1   Cluster 2
Business Intelligence und Data Analytics   Business Intelligence und Data Analytics  Business Intelligence und Data Analytics

Predictive Analytics

Predictive Analytics beschäftigt sich mit der Frage: Was wird künftig passieren? Zur Beantwortung dieser Frage wird auf historische Daten zugegriffen, um anhand quantitativer Methoden Aussagen über die Zukunft zu treffen. In dieser Stufe lassen sich die beiden Prozessschritte Predict und Understand identifizieren.

Predict

Der Prozessschritt Predict beschreibt die Prognose künftiger Ereignisse. Durch die Verwendung von Trainingsdaten sind die Zielklassen bereits bekannt. Man spricht daher auch vomSupervised Machine Learning. Mit Hilfe verschiedenster Algorithmen können Modelle erstellt werden, welche die Daten bestmöglich abbilden. Neue unbekannte Datensätze können anschließend einem Modell übergeben und die erwarteten Klassen bestimmt werden. Beispiele für solche Klassifikationen sind Regressionsmodelle, Entscheidungsbäume oder der k-nearest-neighbors-Algorithmus. Bei den Zielklassen Apfel und Birne würde ein entsprechender Algorithmus, im Gegensatz zu den Clusterverfahren, ein neues Foto auch definitiv einer der beiden Klassen zuordnen.

Klasse Äpfel   Klasse Birnen
Business Intelligence und Data Analytics Business Intelligence und Data Analytics    Business Intelligence und Data Analytics

Understand

Um Vorhersagen sinnvoll anwenden zu können, ist ein tieferes Verständnis der Funktionsweise der angewandten Algorithmen und der zugrundeliegenden Daten notwendig. Da Strukturen und Gemeinsamkeiten innerhalb der Trainingsdaten auch zufällig auftreten können, ist es nötig, die Fragestellung Wie lernt die Maschine? mit den entsprechenden fachlichen Zusammenhängen abzugleichen. In dem Obst-Beispiel wäre das Durchdringen der Entscheidungsweise des gewählten Modells (z.B. Einfluss der Größe, Form und Farbe) hilfreich, wenn man die Anwendung um weitere Obstsorten erweitern möchte.

Erweiterung um eine Obstsorte      
Business Intelligence und Data Analytics      

Zum Durchdringen der Funktionsweise eines Algorithmus gehört auch die Validierung des Models anhand von Testdaten, da Modelle mit einer hohen Treffergenauigkeit nicht automatisch gut sein müssen. Ein HIV-Test, der stur alle Getesteten als gesund einstuft, hätte beispielsweise eine sehr geringe Fehlerrate, da HIV in Deutschland bei weit unter 1 % der Bevölkerung verbreitet ist. Der Wert und das Vertrauen in einen solchen Test wäre entsprechend gering.

 

Prescriptive Analytics

Wie können wir etwas passieren lassen? Wie sich verschiedene Lösungsmöglichkeiten  auf ein Ergebnis auswirken wird in Prescriptive Analytics untersucht. Mit dem Ziel die beste Lösungsmöglichkeit zu identifizieren soll  die Entscheidungsfindung (in Teilen) automatisiert oder eine Handlungsempfehlung ausgegeben werden.

Reason

Im Anschluss an das Verstehen, wie die Maschine auf ein bestimmtes Ergebnis kommt, wird nach kausalen Zusammenhängen zwischen diesen Vorhersagen und den Gegebenheiten der realen Welt gesucht. Durch die Möglichkeit verschiedene Lösungsmöglichkeiten miteinander vergleichen zu können, ist es möglich Handlungsempfehlungen auszugeben und diese kausal begründen zu können. Beispiele für Methoden der Entscheidungsunterstützungen sind Simulationen, bei denen das Verhalten eines Systems modelliert wird, oder Optimierungsverfahren zur Bestimmung der besten Zielfunktion. Auf diesen Methoden aufbauende Programme sind deshalb auch unter dem Begriff Decision Support Systems bekannt.

 

Cognitive Analytics

Unter Cognitive Analytics versteht man Anwendungen, die eine menschenähnliche Intelligenz für das Lösen bestimmter Aufgaben aufbringen können. Durch die Kombination von Datenanalyse in Echtzeit und Machine Learning Algorithmen ist es möglich, Anwendungen umzusetzen, die anhand der Interaktionen von Menschen und Daten dazulernen und schlauer und effektiver werden.

Improve

Der Prozessschritt Improve macht sich die Möglichkeiten der übrigen Analytics Stages zunutze. Durch die simultane Verarbeitung von einer großen Menge an Informationen können in Echtzeit relevante Entscheidungen getroffen werden. Das bekannteste Projekt in diesem Bereich ist Watson von IBM – Ein Computersystem, welches eigenständig Fragen in natürlicher Sprache beantworten kann und im Jahr 2011 in der Quizshow Jeopardy! die menschlichen Gegner mit großem Vorsprung besiegte.

 

Bei der Identifikation von Einsatzmöglichkeiten der Analytics Stages in Ihrem Unternehmen unterstützen wir Sie gerne. Wir freuen uns auf ihren Anruf oder ihre Mail.

 

 

Michael Kormann
Autor: Michael Kormann
Michael Kormann ist als Business und Data Analyst bei der BBHT Beratungsgesellschaft tätig. Seine analytischen Fähigkeiten bringt er seit 2017 in das Business Intelligence Team der BBHT und in die Projekte unserer Kunden ein.

Cookies erleichtern die Bereitstellung unserer Dienste. Mit der Nutzung unserer Dienste erklären Sie sich damit einverstanden, dass wir Cookies verwenden.
Weitere Informationen Ok