freiberufler Data Scientist, Data Engineer, Softwareentwickler und Experte für automatisiertes Feature Engineering auf relationalen Daten und Zeitreihen auf freelance.de

Data Scientist, Data Engineer, Softwareentwickler und Experte für automatisiertes Feature Engineering auf relationalen Daten...

zuletzt online vor 1 Tagen
  • auf Anfrage
  • München
  • Weltweit
  • de  |  en  |  zh
  • 01.07.2024

Kurzvorstellung

Entwicklung von produktiven Machine-Learning-Pipelines, z.B. Customer Churn, Kundenaktivierungskampagnen, Customer Lifetime Value, Targeted Advertising, Cross-Selling, Sales Prediction oder Predictive Maintenance.

Qualifikationen

  • Amazon Web Services (AWS)3 J.
  • C++11 J.
  • Data Science2 J.
  • Go (Programmiersprache)7 J.
  • Künstliche Intelligenz
  • Maschinelles Lernen11 J.
  • Projektleitung / Teamleitung (IT)2 J.
  • Projektmanagement (IT)2 J.
  • Python11 J.
  • SQL4 J.

Projekt‐ & Berufserfahrung

Electricity price prediction
“Big 4” German energy provider, München
4/2022 – offen (2 Jahre, 8 Monate)
Versorgungswirtschaft
Tätigkeitszeitraum

4/2022 – offen

Tätigkeitsbeschreibung

- Developed systems for predicting electricity prices in light of market volatility related to the Ukraine crisis and the increasing market share of renewable energy sources

- Introduced static typing, static code analysis and functional-style programming to the Python code

- Significantly improved the code quality and maintainability of the existing codebase

- Developed systems used to make critical decisions necessary to stabilise the German electricity grid

Eingesetzte Qualifikationen

Amazon Web Services (AWS), C++, Projektleitung / Teamleitung (IT), Projektmanagement (IT), Python

Digitally enabled audit
“Big 4” accounting firm, München
9/2021 – 3/2022 (7 Monate)
Wirtschaftsprüfung
Tätigkeitszeitraum

9/2021 – 3/2022

Tätigkeitsbeschreibung

- Designed and developed tools and components for data extraction, integration and processing to be used for auditing businesses

- Established best-practice coding standards within the software development team

- Significantly improved code quality and maintainability of the existing codebase achieving pylint scores of 9.5-10 for each of the modules

- Introduced static typing, static code analysis and functional-style programming to the Python code, massively reducing the amount of required testing

- Developed the component for extracting data from SAP, which is now being used for auditing businesses world-wide

Eingesetzte Qualifikationen

Cloud (allg.), Python, SAP ABAP, Software Design

Data Scientist, Data Engineer
Landeslotterie aus dem Deutschen Lotto- und Totobl, München
7/2020 – 9/2020 (3 Monate)
Dienstleistungsbranche
Tätigkeitszeitraum

7/2020 – 9/2020

Tätigkeitsbeschreibung

- Entwicklung eines Prognosesystem zur Kundenreaktivierung

- Evaluierung des Systems durch A/B-Testing in einer Postwurfsendung mit mehreren zehntausend Empfängern

- Verdreifachung des Return on Investments (ROI) einer Kampagne im direkten A/B-Test.

Eingesetzte Qualifikationen

Data Science, Maschinelles Lernen, Python

Data Scientist, Data Engineer
Unternehmen aus der Krankenversicherungsbranche, München
11/2019 – 2/2020 (4 Monate)
Versicherungen
Tätigkeitszeitraum

11/2019 – 2/2020

Tätigkeitsbeschreibung

- Analyse von Patientendaten, um die Wahrscheinlichkeit einer Rehospitalisierung aufgrund chronischer Erkrankungen zu ermitteln

- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehende manuelle Features

- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als manuelle Features

- Kunde ist aufgrund des entwickelten Modells in der Lage, deutlich besser zu planen

Eingesetzte Qualifikationen

Data Science, Maschinelles Lernen, Python

Data Scientist, Data Engineer
Vivawest, München
4/2019 – 6/2019 (3 Monate)
Wohnungswirtschaft
Tätigkeitszeitraum

4/2019 – 6/2019

Tätigkeitsbeschreibung

- Vivawest ist einer der größten deutschen Wohnungsanbieter

- Customer Churn in der Wohnungswirtschaft: Entwicklung eines Prognosesystems für die Wahrscheinlichkeit der Kündigung eines Mietvertrags durch den Mieter/die Mieterin

- Aufgrund des Systems ist dem Kunden eine bessere Planung möglich

Eingesetzte Qualifikationen

Data Science, Maschinelles Lernen, Python

Data Scientist, Data Engineer
Global operierendes Unternehmen im Retailbereich, München
2/2019 – 4/2019 (3 Monate)
Großhandel
Tätigkeitszeitraum

2/2019 – 4/2019

Tätigkeitsbeschreibung

- Global operierendes Unternehmen im Retailbereich

- Entwicklung eines Systems zur Warenabsatzprognose zur Optimierung der weltweiten Lagerhaltung/Logistik

- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehendes Prognosesystem

- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als das bestehende Prognosesystem

- Deutlich bessere Planbarkeit der Lagerhaltung möglich

Eingesetzte Qualifikationen

Data Science, Maschinelles Lernen, Python

Data Scientist, Data Engineer
Automobilkonzern, München
7/2018 – 11/2018 (5 Monate)
Automobilindustrie
Tätigkeitszeitraum

7/2018 – 11/2018

Tätigkeitsbeschreibung

- Prognose der Kundenloyalität im Bereich Sales und Aftersales für alle Kunden in einem der umsatzstärksten europäischen Märkte

- Entwicklung eines Algorithmus zur Datenbereinigung, Identifizierung von Doubletten

- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehende manuelle Features

- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als manuelle Features bei deutlich reduziertem Zeitaufwand

- Livesetzung des erfolgreichen Prototypen mittels AWS, Verknüpfung mit SAP/CRM

- Ermöglicht zielgenaues Einsetzen von Ressourcen in sämtlichen Sales und Aftersales-Kampagnen für alle Kampagnen in diesem großen europäischen Land

- Nachweisliche Erhöhung der Kundenloyalität

Eingesetzte Qualifikationen

Amazon Web Services (AWS), Docker, Go (Programmiersprache), Python, SQL

Data Scientist
Automobilkonzern, München
2/2018 – 5/2018 (4 Monate)
Automobilindustrie
Tätigkeitszeitraum

2/2018 – 5/2018

Tätigkeitsbeschreibung

- Erstellung eines Proofs-of-Concept für die Prognose von Kundenloyalität im Bereich Aftersales für alle Kunden in einem außereuropäischen Markt

- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehende manuelle Features

- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als manuelle Features bei deutlich reduziertem Zeitaufwand

- Ermöglicht zielgenaues Einsetzen von Ressourcen in sämtlichen Aftersales-Kampagnen für alle Kampagnen in diesem außereuropäischen Land

- Vorstellung der Ergebnisse vor dem Vorstand

- Proof-of-Concept wurde von dem Vorstand als enorm erfolgreich bewertet

- Aufgrund dieses erfolgreichen Proofs-of-Concept hat der Vorstand beschlossen, eine Cloud-Infrastruktur zur Livesetzung von Data-Science-Projekten aufzubauen

Eingesetzte Qualifikationen

Maschinelles Lernen, Python, SQL

Data Scientist
Carl Zeiss, München
11/2017 – 12/2017 (2 Monate)
Maschinen-, Geräte- und Komponentenbau
Tätigkeitszeitraum

11/2017 – 12/2017

Tätigkeitsbeschreibung

- Entwicklung eines Predictive-Maintenance-Systems auf Basis von Sensordaten aus weltweit im Einsatz befindlichen Fertigungsanlagen optischer Komponenten (~300 GB)

- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehende manuelle Features

- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als manuelle Features bei deutlich reduziertem Zeitaufwand

- Deutlich akkuratere Prognose als zuvor möglich

Eingesetzte Qualifikationen

Maschinelles Lernen, Python

Co-Founder, Lead Developer (Festanstellung)
getML, München
7/2017 – offen (7 Jahre, 5 Monate)
IT & Entwicklung
Tätigkeitszeitraum

7/2017 – offen

Tätigkeitsbeschreibung

- Technische Leitung der Entwicklung von getML, eines Softwarepakets für automatisiertes Feature Engineering auf relationalen Daten und Zeitreihen
Entwicklung von innovativen Algorithmen für relationales Lernen, Patentierung dieser Algorithmen

- Software reduziert den Zeitaufwand eines Data-Science-Projekts um bis zu 80%

- Insbesondere geeignet für Customer Churn, Kundenaktivierungskampagnen, Customer Lifetime Value, Targeted Advertising, Up- und Cross-Selling, Sales Prediction oder Predictive Maintenance

- Beteiligung an zahlreichen Machine-Learning-Projekten auf relationalen Daten und Zeitreihen

Eingesetzte Qualifikationen

C++, Go (Programmiersprache), Maschinelles Lernen, Python

Data Scientist (Festanstellung)
Volkswagen Data:Lab, München
7/2016 – 6/2017 (1 Jahr)
Automobilindustrie
Tätigkeitszeitraum

7/2016 – 6/2017

Tätigkeitsbeschreibung

- Beteiligung an zahlreiche Machine-Learning-Projekten auf relationalen Daten und Zeitreihen

- Projekte ermöglichten Einsparungen in Millionenhöhe

Eingesetzte Qualifikationen

C++, Keras, Maschinelles Lernen, Python, Pytorch, SQL, Tensorflow

Data Scientist, Data Engineer
Bekannter deutscher Online-Retailer, Göttingen
7/2014 – 6/2015 (1 Jahr)
Handel
Tätigkeitszeitraum

7/2014 – 6/2015

Tätigkeitsbeschreibung

- Projektarbeit im Rahmen meiner Promotion

- Entwicklung eines Systems für die Live-Prognose von Retouren während der Kunde/die Kundin den Warenkorb erstellt

- Erarbeitung von Interventionsstrategien

- Geschätzte Kosteneinsparung: 300.000-500.000 EUR im Jahr

Eingesetzte Qualifikationen

Data Science, Maschinelles Lernen, Python, SQL

Wissenschaftlicher Mitarbeiter (Doktorand)
Institut für Wirtschaftsinformatik, Georg-August U, Göttingen
11/2013 – 5/2016 (2 Jahre, 7 Monate)
Hochschulen und Forschungseinrichtungen
Tätigkeitszeitraum

11/2013 – 5/2016

Tätigkeitsbeschreibung

- Doktorarbeit: Essays on Predictive Analytics in E-Commerce, befasste sich mit der Entwicklung von Machine-Learning-Algorithmen speziell für Business-Fragestellungen und deren Anwendung in einem E-Commerce-Kontext

- Damals schnellster Doktorand in der Geschichte des Instituts

- Note: summa cum laude

- Lehrveranstaltungen zu diversen Themen, unter anderem Machine Learning

- Beteiligung an Projektarbeiten zum Thema Machine Learning auf Businessdaten

Eingesetzte Qualifikationen

C++, Maschinelles Lernen, Python, SQL

Ausbildung

Wirtschaftsinformatik
Promotion, summa cum laude
2016
Göttingen
Management of Technology
Master of Science, 50% aller Kurse auf Mandarin
2012
Taichung, Taiwan
Volkswirtschaftslehre
Bachelor of Arts
2009
München

Über mich

Im Rahmen meiner Promotion und meiner frühen Projektarbeit habe ich gesehen, was für ein Zeit- und Kostenaufwand manuelles Feature Engineering bedeuten kann. Daher habe ich im Jahre 2017 gemeinsam mit meinem Geschäftspartner getML gegründet.

getML ist eine Software für automatisiertes Feature Engineering auf relationalen Daten und Zeitreihen.

Automatisiertes Feature Engineerung erlaubt es, den Zeit- und Kostenaufwand eines Data Science Projekts um bis zu 80% zu reduzieren, insbesondere auf Problemen wir Customer Churn, Kundenaktivierungskampagnen, Customer Lifetime Value, Targeted Advertising, Up- und Cross-Selling, Sales Prediction oder Predictive Maintenance.

getML besetzt Spitzenpositionen auf zahlreichen Benchmark-Datensätzen und ist bis zu 75x effizienter und schneller als vergleichbare Ansätze. Zudem haben wir unsere Technologie in zahlreichen Projekten gegen bestehende manuelle Features gebenchmarkt und bewiesen, dass wir bessere Features in deutlich kürzerer Zeit generieren können als mit manuellem Feature Engineering.

Die generierten Features lassen sich in komplett funktionsfähiges SQL transpilieren. So können produktive Data-Science-Pipelines in kurzer Zeit erstellt werden.

Zu unseren Kunden gehören unter anderem Volkswagen und Carl Zeiss.

Über unsere Technologie wurde auch in überregionalen Medien berichtet, wie zum Beispiel der Frankfurter Allgemeinen Zeitung (FAZ).

Unsere Technologie wurde unter anderen durch das LMU Entrepeneurship Center der LMU München, das Techboost StartUp-Programm der Deutschen Telekom und aws.activate von Amazon gefördert.

Weitere Kenntnisse

ICH BIETE

Entwicklung von produktiven Machine-Learning-Pipelines, z.B. Customer Churn, Kundenaktivierungskampagnen, Customer Lifetime Value, Targeted Advertising, Up- und Cross-Selling, Sales Prediction, Fraud Prediction oder Predictive Maintenance

Kombination von Statistik und Machine Learning mit Best Practises der Softwareentwicklung für stabile und nachhaltige datengetriebene Software und Data Pipelines

Technische Leitung von agilen Softwareentwicklungs- und Data-Science-Projekten


SPEZIALWISSEN

Besondere Expertise im Bereich automatisiertes Feature Engineering auf relationalen Daten und Zeitreihen. Automatisiertes Feature Engineering reduziert den Zeit- und Kostenaufwand eines Data-Science-Projekts um bis zu 80%, insbesondere bei Projekten wie den oben genannten.

Von mir entwickelte Algorithmen für automatisiertes Feature Engineering besetzen Spitzenpositionen auf zahlreichen Benchmark-Datensätzen und sind bis zu 75x effizienter und schneller als vergleichbare Ansätze.


FÄHIGKEITEN UND FERTIGKEITEN

Artificial Intelligence, Machine Learning, Predictive Analytics, Data Science, Data Pipelines, Datenmodellierung, Big Data, Customer Churn, Kundenaktivierung, Upselling, Cross-Selling, Customer Lifetime Value (CLV), Targeted Advertising, Predictive Maintenance, Sensordaten, Relationale Daten, Zeitreihen, Forecasting, Optimierung, Scrum, Kanban


PROGRAMMIERSPRACHEN

Jahrzehntelange Programmiererfahrung. Im Alter von 10 Jahren das Programmieren angefangen. Besonders häufig: C++, Golang, Python, SQL. Ebenfalls: C, R, Scala, Java, JavaScript, TypeScript, Swift, Rust, FORTRAN


TECHNOLOGIEN

Pytorch, Tensorflow, CUDA, MPI, numpy, scipy, matplotlib, xgboost, lightgbm, scikit-learn, keras, GPU, sqlite, Spark, pyspark, Datenbanken, PostgreSQL, MySQL, MariaDB, Oracle SQL, Greenplum, Microsoft SQL Server, SAP HANA, Teradata, Hadoop, Hive,NoSQL, Elastic Search, Data Lake, Data Warehouse, Docker, CI/CD, Continuous integration, Continuous delivery, Agile development, Airflow, Jenkins, Cloud, Amazon Web Services (AWS), Azure, S3, lambda, boto3, REST, flask, Django, API development, Algorithm development, Git, Version Control, HTML, CSS, full-stack developer, ETL, Bash, Shell, Terminal, low-level communication protocols, TCP/IP, TLS/SSL

Persönliche Daten

Sprache
  • Deutsch (Muttersprache)
  • Englisch (Fließend)
  • Chinesisch (Fließend)
Reisebereitschaft
Weltweit
Arbeitserlaubnis
  • Europäische Union
Home-Office
bevorzugt
Profilaufrufe
1175
Alter
37
Berufserfahrung
11 Jahre (seit 11/2013)
Projektleitung
7 Jahre

Kontaktdaten

Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.

Jetzt Mitglied werden