Machine Learning als Grundlage datenbasierter Automatisierung

Wenn Sie einen Prozess, eine Entscheidung oder eine Aufgabe automatisieren wollen, benötigen Sie ein Modell, dass die Zusammenhänge korrekt darstellt. Machine Learning ermöglicht die Bildung von Modellen aus Daten – im Gegensatz zur klassischen Modellbildung aus reinem Systemwissen. In diesem Artikel erhalten Sie eine Übersicht über Machine Learning Methoden und die wichtigsten Schritte zur erfolgreichen Anwendung.

 

Machine Learning ist die Modellbildung aus Daten, also die Abbildung von Zusammenhängen.

Modellbildung

Egal, ob Sie eine Prognose für die Zukunft machen, z.B. über den Umsatz im kommenden Jahr, oder ob Sie eine Entscheidung treffen, z.B. die Priorisierung von Leads bei der Akquise von Neukunden: um ein gutes Ergebnis zu erzielen, müssen Sie die Zusammenhänge verstehen. Das kann implizit auf Ihrer Erfahrung basieren oder explizit auf vorgegebenen Regeln beruhen. Sie benötigen eine möglichst strukturähnliche Abbildung der Realität: ein Modell. Dieses Modell beschreibt den Zusammenhang zwischen vorliegenden Eingangsdaten und der zu treffenden Aussage. Methoden des Machine Learnings ermöglichen die Modellbildung aus vorhandenen Vergangenheitsdaten.

Begriffsklärung und Übersicht

Was in diesem Zusammenhand immer wieder verwirrt ist die Vielzahl an Begriffen, die aktuell verwendet werden; Begriffe wie Künstliche Intelligenz, Machine Learning, künstliche Neuronale Netze, Deep Learning, usw. Hier ein Versuch, diese etwas zu ordnen: Künstliche Intelligenz (KI) ist ein weit gefasster Oberbegriff, der eine Menge von Feldern beinhaltet, von Wissensstrukturierung über die Themen der Robotik inkl. Perzeption und Manipulation, bis hin zur Planung von Abläufen und Ähnlichem. Der Bereich des Machine Learnings kann ebenfalls als Teilgebiet der KI betrachtet werden und umfasst die Modellbildung auf Basis von Daten. Supervised Learning (das überwachte Lernen), Unsupervised Learning (das selbstständige Lernen) und Reinforcement Learning (das verstärkende Lernen) sind Teilgebiete des Machine Learning, denen die verschiedenen Methoden der Klassifikation, Regression, Clustering, Dimensions Reduktion, Neuronale Netze und auch Deep Learning zugeordnet werden können.

Machine Learning Prozess

Unabhängig davon, welche Methoden Anwendung findet: das Vorgehen ist in allen Fällen sehr ähnlich. Wie in der Graphik oben abgebildet, erstellt ein prädiktives Modell eine wahrscheinliche Aussage (das sogenannte “erwartete Label”) basierend auf Eingangsdaten. Anstatt diese Abbildung per Hand aufzuschreiben – z.B. könnten wir den Umsatz (Aussage) auf Basis des Vorjahresumsatzes (Eingangsdaten) multipliziert mit einem Wachstumsfaktor X schätzen – können wir Machine Learning Methoden zur Modellbildung verwenden. In vielen Fällen ist das Modell dann besser und vollständiger als per Hand, insbesondere wenn die Daten vielschichtig (hoch-dimensional) sind und die Zusammenhänge komplexer Natur sind (z.B. von mehr als einer Eingangsvariable abhängen). Die Modellbildung besteht aus folgenden Schritten (ein detaillierter Überblick über Herangehensweisen für Datennutzung allgemein siehe hier):

1. Datensammlung

Als Grundlage für die Modellbildung dienen Vergangenheitsdaten, um das Modell zu trainieren. Hierbei kommt es neben einer ausreichenden Datenmenge, welche je nach Methode variiert, auch sehr stark auf die Qualität der Daten an (über Datenmenge und -qualität habe ich in diesem Artikel bereits geschrieben). Auf das Beispiel der Umsatzprognose bezogen: welche Faktoren könnten den Umsatz beeinflussen? Wie kann ich diese Faktoren messbar und verfügbar machen?

2. Merkmale

Als nächstes werden aus den vorhandenen Daten relevante Merkmale extrahiert, berechnet und ausgewählt (genannt Feature Extraction und Feature Selection). Denn nicht alle Faktoren haben den gleichen Einfluss auf die Aussage des Modells. Dieser Schritt kann bei einigen Methoden, wie z.B. den Neuronalen Netzen, teilweise automatisch integriert sein, erfordert dann aber meist signifikant größere Datenmengen als Ausgangspunkt.

3. Modelltraining

Ist das Problem ausreichend definiert, kann eine geeignete Machine Learning Methode ausgewählt und mit Daten trainiert werden. Im Beispiel der Umsatzprognose wäre das ein Regressionsmodell, bei der Zuordnung zu diskreten Klassen, z.B. gut/schlecht bei der Qualitätskontrolle, würde eine Klassifikationsmethode zum Einsatz kommen. Beim Modelltraining kommt es darauf an, sowohl den sogenannten Fit des Modells auf die Trainingsdaten zu maximieren und gleichzeitig die Generalisierbarkeit auf neue Daten zu optimieren (hierfür benutzt man z.B. die Cross-Validation). Nur wenn das gelingt, ist das entstehende Modell auch im Einsatz erfolgreich.

Fazit

Machine Learning Methoden erleichtern das Erstellen von Modellen auf Basis von Vergangenheitsdaten. Um sie erfolgreich zur datenbasierten Automatisierung einzusetzen, bedarf es zwei wesentlicher Faktoren: Eine klar formulierte Fragestellung ist essentiell, um das richtiges Modell zu bauen und die Qualität und Quantität der zu verwendenden Daten ist wichtig, um das Modell richtig zu bauen. Wenn Sie diese Punkte berücksichtigen, kann der Einsatz von Machine Learning in Ihrem Unternehmen enorme Vorteile bringen.

Über Fragen, Feedback, Diskussionen und Anregungen freue ich mich: Schreiben Sie mir!

P.S.: In meinem Seminar über datenbasierte Entscheidungen gehe ich noch tiefer auf die Methoden ein. Außerdem lernen Sie die Anwendung der Technologien auf Entscheidungen und Geschäftsprozesse, in welchem Rahmen das möglich ist, wie die Daten beschaffen sein müssen und welche Fragen Sie stellen müssen. Mehr Informationen dazu in Kürze auf www.datenbasierte-entscheidungen.de