Big data – Industrie 4.0 – MES (manufacturing execution systeme) – Was diese drei Begriffe mit sich bringen ist eine immer stärkere Vernetzung von Systemelementen und Systemen und damit die Generierung von unglaublichen Datenmengen. Die Analyse dieser Datenberge stellt neue Herausforderungen an Unternehmen und es bedarf dazu spezieller statistischer Methoden.
Unser Training zum zertifizierten „Data mining analyst“ vermittelt Ihnen die Fähigkeiten, Wissen aus großen Datenmengen zu extrahieren und daraus nützliche Schlüsse zu ziehen. Wir orientieren uns hierbei am CRISP-DM (cross industry standard process for data mining).
Der Fokus liegt auf der Anwendung und richtigen Auswahl der Methoden (erläutert anhand der Statistikprogramme Jump und Rapid Miner).
Mit Hilfe von praxisnahen Fallbeispielen werden Ihnen die einzelnen Themengebiete spannend und interaktiv nähergebracht.
Werden Sie in nur 6 Tagen zum Experten für die Analyse großer Datenbestände.“
Nächstes "Data Mining Analyst" - Training:
Modul I: 11.-13. September 2017
Modul II: 07.-09. November 2017
Data miner haben die Aufgabe, aus großen Datenmengen neue Erkenntnisse zu gewinnen und daraus Prognosen und Maßnahmen abzuleiten. Neben „data mining“ ist hierbei auch der Begriff „predictive analytics“ gebräuchlich. Die vorliegende Ausbildung spricht hierbei zwei sehr wesentliche Anwendungsfälle an:
In der Produktion stehen durch sogenannte „manufacturing execution systeme“ (MES) mehr Daten als bisher zur Verfügung. Das MES verknüpft Daten aus den unterschiedlichen Systemen – nun braucht es den „data miner“, der daraus die richtigen Schlüsse zieht.
Aus dem Markt gibt es zunehmend Daten, die bezüglich Kundenpräferenzen, Kaufverhalten etc. Auskunft geben. Auch hierzu braucht es den „data miner“, der entsprechende Schlussfolgerungen ziehen kann.
Dieser beschäftigt sich mit dem Auffinden von neuen Verknüpfungen und Mustern in Daten. Hierfür werden fundierte Kenntnisse in den Bereichen Machine Learning, Mathematik und Statistik benötigt. Big Data Analysten entwickeln mathematische oder statistische Modelle und wenden diese auf große Datenmengen an um neue Zusammenhänge und Informationen zu erkennen.
Inhalte:
Data mining und predictive analytics workflows
Grundlagen Big Data: strukturierte und unstrukturierte Daten
Data Sciene und Internet of things (IoT)
Von der explorativen zur präskriptiven Datenanalyse
Anwendungsgebiet von Big Data im Unternehmen
Begrifflichkeiten lt. ISO 13249-6
CRISP-DM
SEMMA Workflow
Einfache Modelle in der Statistik
Streuung und Verteilung
Signal, Rauschen, Signifikanz, Relevanz
Analytische Statistik
Hypothesentest
ANOVA
Regression
Multifaktorielle Verfahren in der Statistik
MANOVA
Diskriminanzanalyse
Logistische Regression
Komplexe Analyseverfahren und Prognosemodelle
Multivariate Verfahren
Data mining workflow
Explorative Datenanalyse
Overfitting, Underfitting
Prognosemodelle
Entscheidungsbäume
Neuronale Netze
Text mining