Hauptinformation

Data Scientists LEAN SIX SIGMA Black Belt

Reisebereitschaft: National

Beruflicher Status: Freelancer

Beratungserfahrung: 20 Jahr/-re

Sprachen: Englisch,

  Zur Person

Als Data Scientist betrachte ich die Fragestellungen aus einem methodenorientierten Blickwinkel. Ich bringe meine Kenntnisse über die zur Verfügung stehenden Algorithmen bzw. Verfahren und mein statistisches Wissen in die Projektdefinition ein. Eine erste Aufgabe ist es gemeinsam mit dem Kunden aus einer betriebswirtschaftlichen Perspektive den möglichen Geschäftserfolg abzuschätzen (ROI). Auch muss hier geklärt werden, welche Use-Cases für eine erste Umsetzung möglich bzw. vom Kunden gewünscht sind. Für alle Data Science Projekte ist die Ist-Aufnahme der bereits vorhandenen Datenbestände ein erster wichtiger Schritt. Hier ist zu klären welche Daten vorliegen und mit welcher Qualität. Aus dieser Information können die weiteren Daten festgelegt werden, die für das Projekt wahrscheinlich erforderlich sind. Dies ist ein iterativer Prozess der im Projektverlauf mehrmals durchlaufen werden muss. Mit dieser ersten Analyse ist eine erste Kosten- und Zeitplanung möglich. Für die Projektdurchführung hat sich der Regelkreis nach der CRISP-DM (Cross-Industry Standard Process) sehr gut bewährt. Sind nun die Randbedingen geklärt kann mit dem Projekt gestartet werden. Hier beginnt die eigentliche Arbeit des Data Scientist. Folgende Hauptpunkte sind nun abzuarbeiten: 1. Verständnis der Daten schaffen 2. Vor- und Aufbereitung der Daten 3. Modellieren mit Hilfe der unterschiedlichen Verfahren 4. Bewertung und Überprüfung der Ergebnisse 5. Bereitstellung und Anwendung der Ergebnisse im produktiven Betrieb Diese 5 Punkte werden mit den Standard Softwaretools und Methoden des Data Scientist abgearbeitet. Erfahrungen liegen mit den folgenden Softwaretools vor. Meine Aufgaben in den verschiedenen durchgeführten Projekten waren neben Projektleitung das Einbringen meiner Kernkompetenzen in die Projekte.

Kernkompetenzen

Kernkompetenzen: 1. Business Analyse 2. Analyse eines bestehenden Prozesses 3. Präsentation der Analyseergebnisse an das Management 4. Software Entwicklung 5. Modellvalidierung 6. Modellentwicklung 7. Datenanalyse und Datenmanagement/ETL-Prozess 8. SAP R3 Einbindung 9. Python und R Programmierung 10. Deskriptive und Quantitative Statistik 11. Python, PySpark, SQL, SparkSQL 12. Hadoop, Spark, Hive, HBase Mathematical, Statistical Background and Advance Analytical Sehr gute Kenntnisse in • Special distributions of a variable • Distributions of several variables • Samples and estimates • Monte Carlo methods • Significance analysis • Testing hypotheses • Regression and linear models • Design of Experiments • Time Series Analysis • Methods for analysing trends • Methods for the analysis of cyclic fluctuations • Methods for analysing seasonal components • Methods for smoothing and filtering time series • Statistical process control (SPC) • Monte Carlo Simulation Statistical Programming • R Sehr gute Kenntnisse • R Studio Sehr gute Kenntnisse • R Shiny (Web App for R) Sehr gute Kenntnisse • Python (2.x and 3.x) Sehr gute Kenntnisse • Rapid Miner Sehr gute Kenntnisse • Minitab Sehr gute Kenntnisse Artificial Intelligence (AI, supervised and unsupervised) • Machine Learning Sehr gute Kenntnisse • Neuronal Network Gute Kenntnisse • Natural language processing Gute Kenntnisse • Classifiers and statistical learning methods Gute Kenntnisse Database • SQL Database o MySQL Sehr gute Kenntnisse • NoSQL Database Sehr gute Kenntnisse o Cassandra Sehr gute Kenntnisse o HBase Gute Kenntnisse o Neo4j Grundkenntnisse Hadoop Ecosystem (Apache Software) • Hortonworks Ecosystem Sehr gute Kenntnisse • Talend (ETL Tool) Sehr gute Kenntnisse • Kafka Gute Kenntnisse • AWS Cloud Gute Kenntnisse • Hive Gute Kenntnisse • Spark Sehr gute Kenntnisse Visualisation Software • Qlik / Qlik Sense Sehr gute Kenntnisse • MS Power BI Sehr gute Kenntnisse • Tableau / Prep Builder Sehr gute Kenntnisse • R Shiny (Web App for R) Sehr gute Kenntnisse ERP System • SAP R3 (verschiedene Module) Sehr gute Kenntnisse Business- und Prozesse-Methoden BPMN Modeling Sehr gute Kenntnisse in • LEAN Six Sigma • Requirements Engineering • Value Stream Mapping • Business Process Engineering • Balanced Scorecard (BSC) and Key-Performance-Indicator (KPI) • Statistical process control (SPC) • Brainstorming • Fishbone-Analyse • Quality Function Deployment (QFD) • Failure Mode and Effects Analysis (FMEA) • Fault Tree Analysis (FTA)

 Kompetenzen

Data Science 13

 Branchen

High-Tech- und Elektroindustrie 20 Hochschulen und Forschungseinrichtungen 11

 Sprachen

Englisch

Gut

Persönliche Daten

Nationalität: deutsch

Arbeitserlaubnis: Europäische Union,

Sicherheitsüberprüfung: k.A.

Berufserfahrung: 20 Jahr/-re