Data Science


Statistik und Datenanalyse

Data Science beschäftigt die sich mit der Extraktion von Wissen aus großen Datenmengen, auch bekannt als Big Data. Data Science verwendet dabei insbesondere Methoden aus Mathematik und Statistik. So können auf Basis der Wahrscheinlichkeitsrechnung und Statistik Trends beobachtet und Prognosen aufgestellt werden. Insbesondere die Techniken Regressionsanalyse (Regression Analysis), Klassifizierung durch Entscheidungsbäume (Classification and Regression Trees) und Ähnlichkeitsanalyse (Similarity Matching) spielen heutzutage eine große Rolle.

Bekannte Themen sind die Anomalie-Erkennung in IT- und Produktionssystemen, die Prognose von Verkaufszahlen und Produktionskosten, die Diagnosefindung und Auswahl von Behandlungsplänen im Gesundheitswesen, sowie die Generierung von Regelwerken für die Marketing Automation.

Tools die häufig zum Einsatz kommen sind R, RapidMiner oder KNIME. Aber auch Programmiersprachen wie Phyton oder Java werden benötigt.

Data Science ist mittlerweile so etabliert, dass es dazu schon Bachelor als auch im Master Studiengänge gibt. Beispielhaft dafür seien die Universität Marburg, die Universität Stuttgart und die Universität Göttingen genannt. Hier lernt man aus Daten Erkenntnisse zu gewinnen und unterstützt so Unternehmen bei der Entscheidungsfindung.