Data Scientist, Data Engineer, Softwareentwickler und Experte für automatisiertes Feature Engineering auf relationalen Daten...
- Verfügbarkeit einsehen
- 0 Referenzen
- auf Anfrage
- München
- Weltweit
- de | en | zh
- 01.07.2024
Kurzvorstellung
Qualifikationen
Projekt‐ & Berufserfahrung
4/2022 – offen
Tätigkeitsbeschreibung
- Developed systems for predicting electricity prices in light of market volatility related to the Ukraine crisis and the increasing market share of renewable energy sources
- Introduced static typing, static code analysis and functional-style programming to the Python code
- Significantly improved the code quality and maintainability of the existing codebase
- Developed systems used to make critical decisions necessary to stabilise the German electricity grid
Amazon Web Services (AWS), C++, Projektleitung / Teamleitung (IT), Projektmanagement (IT), Python
9/2021 – 3/2022
Tätigkeitsbeschreibung
- Designed and developed tools and components for data extraction, integration and processing to be used for auditing businesses
- Established best-practice coding standards within the software development team
- Significantly improved code quality and maintainability of the existing codebase achieving pylint scores of 9.5-10 for each of the modules
- Introduced static typing, static code analysis and functional-style programming to the Python code, massively reducing the amount of required testing
- Developed the component for extracting data from SAP, which is now being used for auditing businesses world-wide
Cloud (allg.), Python, SAP ABAP, Software Design
7/2020 – 9/2020
Tätigkeitsbeschreibung
- Entwicklung eines Prognosesystem zur Kundenreaktivierung
- Evaluierung des Systems durch A/B-Testing in einer Postwurfsendung mit mehreren zehntausend Empfängern
- Verdreifachung des Return on Investments (ROI) einer Kampagne im direkten A/B-Test.
Data Science, Maschinelles Lernen, Python
11/2019 – 2/2020
Tätigkeitsbeschreibung
- Analyse von Patientendaten, um die Wahrscheinlichkeit einer Rehospitalisierung aufgrund chronischer Erkrankungen zu ermitteln
- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehende manuelle Features
- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als manuelle Features
- Kunde ist aufgrund des entwickelten Modells in der Lage, deutlich besser zu planen
Data Science, Maschinelles Lernen, Python
4/2019 – 6/2019
Tätigkeitsbeschreibung
- Vivawest ist einer der größten deutschen Wohnungsanbieter
- Customer Churn in der Wohnungswirtschaft: Entwicklung eines Prognosesystems für die Wahrscheinlichkeit der Kündigung eines Mietvertrags durch den Mieter/die Mieterin
- Aufgrund des Systems ist dem Kunden eine bessere Planung möglich
Data Science, Maschinelles Lernen, Python
2/2019 – 4/2019
Tätigkeitsbeschreibung
- Global operierendes Unternehmen im Retailbereich
- Entwicklung eines Systems zur Warenabsatzprognose zur Optimierung der weltweiten Lagerhaltung/Logistik
- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehendes Prognosesystem
- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als das bestehende Prognosesystem
- Deutlich bessere Planbarkeit der Lagerhaltung möglich
Data Science, Maschinelles Lernen, Python
7/2018 – 11/2018
Tätigkeitsbeschreibung
- Prognose der Kundenloyalität im Bereich Sales und Aftersales für alle Kunden in einem der umsatzstärksten europäischen Märkte
- Entwicklung eines Algorithmus zur Datenbereinigung, Identifizierung von Doubletten
- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehende manuelle Features
- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als manuelle Features bei deutlich reduziertem Zeitaufwand
- Livesetzung des erfolgreichen Prototypen mittels AWS, Verknüpfung mit SAP/CRM
- Ermöglicht zielgenaues Einsetzen von Ressourcen in sämtlichen Sales und Aftersales-Kampagnen für alle Kampagnen in diesem großen europäischen Land
- Nachweisliche Erhöhung der Kundenloyalität
Amazon Web Services (AWS), Docker, Go (Programmiersprache), Python, SQL
2/2018 – 5/2018
Tätigkeitsbeschreibung
- Erstellung eines Proofs-of-Concept für die Prognose von Kundenloyalität im Bereich Aftersales für alle Kunden in einem außereuropäischen Markt
- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehende manuelle Features
- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als manuelle Features bei deutlich reduziertem Zeitaufwand
- Ermöglicht zielgenaues Einsetzen von Ressourcen in sämtlichen Aftersales-Kampagnen für alle Kampagnen in diesem außereuropäischen Land
- Vorstellung der Ergebnisse vor dem Vorstand
- Proof-of-Concept wurde von dem Vorstand als enorm erfolgreich bewertet
- Aufgrund dieses erfolgreichen Proofs-of-Concept hat der Vorstand beschlossen, eine Cloud-Infrastruktur zur Livesetzung von Data-Science-Projekten aufzubauen
Maschinelles Lernen, Python, SQL
11/2017 – 12/2017
Tätigkeitsbeschreibung
- Entwicklung eines Predictive-Maintenance-Systems auf Basis von Sensordaten aus weltweit im Einsatz befindlichen Fertigungsanlagen optischer Komponenten (~300 GB)
- Erstellung von Features mittels entwickelter Algorithmen für automatisiertes Feature Engineerung, Benchmark gegen bestehende manuelle Features
- Ergebnis: Automatische Features generieren deutlich akkuratere Prognosen als manuelle Features bei deutlich reduziertem Zeitaufwand
- Deutlich akkuratere Prognose als zuvor möglich
Maschinelles Lernen, Python
7/2017 – offen
Tätigkeitsbeschreibung
- Technische Leitung der Entwicklung von getML, eines Softwarepakets für automatisiertes Feature Engineering auf relationalen Daten und Zeitreihen
Entwicklung von innovativen Algorithmen für relationales Lernen, Patentierung dieser Algorithmen
- Software reduziert den Zeitaufwand eines Data-Science-Projekts um bis zu 80%
- Insbesondere geeignet für Customer Churn, Kundenaktivierungskampagnen, Customer Lifetime Value, Targeted Advertising, Up- und Cross-Selling, Sales Prediction oder Predictive Maintenance
- Beteiligung an zahlreichen Machine-Learning-Projekten auf relationalen Daten und Zeitreihen
C++, Go (Programmiersprache), Maschinelles Lernen, Python
7/2016 – 6/2017
Tätigkeitsbeschreibung
- Beteiligung an zahlreiche Machine-Learning-Projekten auf relationalen Daten und Zeitreihen
- Projekte ermöglichten Einsparungen in Millionenhöhe
C++, Keras, Maschinelles Lernen, Python, Pytorch, SQL, Tensorflow
7/2014 – 6/2015
Tätigkeitsbeschreibung
- Projektarbeit im Rahmen meiner Promotion
- Entwicklung eines Systems für die Live-Prognose von Retouren während der Kunde/die Kundin den Warenkorb erstellt
- Erarbeitung von Interventionsstrategien
- Geschätzte Kosteneinsparung: 300.000-500.000 EUR im Jahr
Data Science, Maschinelles Lernen, Python, SQL
11/2013 – 5/2016
Tätigkeitsbeschreibung
- Doktorarbeit: Essays on Predictive Analytics in E-Commerce, befasste sich mit der Entwicklung von Machine-Learning-Algorithmen speziell für Business-Fragestellungen und deren Anwendung in einem E-Commerce-Kontext
- Damals schnellster Doktorand in der Geschichte des Instituts
- Note: summa cum laude
- Lehrveranstaltungen zu diversen Themen, unter anderem Machine Learning
- Beteiligung an Projektarbeiten zum Thema Machine Learning auf Businessdaten
C++, Maschinelles Lernen, Python, SQL
Ausbildung
Göttingen
Taichung, Taiwan
München
Über mich
getML ist eine Software für automatisiertes Feature Engineering auf relationalen Daten und Zeitreihen.
Automatisiertes Feature Engineerung erlaubt es, den Zeit- und Kostenaufwand eines Data Science Projekts um bis zu 80% zu reduzieren, insbesondere auf Problemen wir Customer Churn, Kundenaktivierungskampagnen, Customer Lifetime Value, Targeted Advertising, Up- und Cross-Selling, Sales Prediction oder Predictive Maintenance.
getML besetzt Spitzenpositionen auf zahlreichen Benchmark-Datensätzen und ist bis zu 75x effizienter und schneller als vergleichbare Ansätze. Zudem haben wir unsere Technologie in zahlreichen Projekten gegen bestehende manuelle Features gebenchmarkt und bewiesen, dass wir bessere Features in deutlich kürzerer Zeit generieren können als mit manuellem Feature Engineering.
Die generierten Features lassen sich in komplett funktionsfähiges SQL transpilieren. So können produktive Data-Science-Pipelines in kurzer Zeit erstellt werden.
Zu unseren Kunden gehören unter anderem Volkswagen und Carl Zeiss.
Über unsere Technologie wurde auch in überregionalen Medien berichtet, wie zum Beispiel der Frankfurter Allgemeinen Zeitung (FAZ).
Unsere Technologie wurde unter anderen durch das LMU Entrepeneurship Center der LMU München, das Techboost StartUp-Programm der Deutschen Telekom und aws.activate von Amazon gefördert.
Weitere Kenntnisse
Entwicklung von produktiven Machine-Learning-Pipelines, z.B. Customer Churn, Kundenaktivierungskampagnen, Customer Lifetime Value, Targeted Advertising, Up- und Cross-Selling, Sales Prediction, Fraud Prediction oder Predictive Maintenance
Kombination von Statistik und Machine Learning mit Best Practises der Softwareentwicklung für stabile und nachhaltige datengetriebene Software und Data Pipelines
Technische Leitung von agilen Softwareentwicklungs- und Data-Science-Projekten
SPEZIALWISSEN
Besondere Expertise im Bereich automatisiertes Feature Engineering auf relationalen Daten und Zeitreihen. Automatisiertes Feature Engineering reduziert den Zeit- und Kostenaufwand eines Data-Science-Projekts um bis zu 80%, insbesondere bei Projekten wie den oben genannten.
Von mir entwickelte Algorithmen für automatisiertes Feature Engineering besetzen Spitzenpositionen auf zahlreichen Benchmark-Datensätzen und sind bis zu 75x effizienter und schneller als vergleichbare Ansätze.
FÄHIGKEITEN UND FERTIGKEITEN
Artificial Intelligence, Machine Learning, Predictive Analytics, Data Science, Data Pipelines, Datenmodellierung, Big Data, Customer Churn, Kundenaktivierung, Upselling, Cross-Selling, Customer Lifetime Value (CLV), Targeted Advertising, Predictive Maintenance, Sensordaten, Relationale Daten, Zeitreihen, Forecasting, Optimierung, Scrum, Kanban
PROGRAMMIERSPRACHEN
Jahrzehntelange Programmiererfahrung. Im Alter von 10 Jahren das Programmieren angefangen. Besonders häufig: C++, Golang, Python, SQL. Ebenfalls: C, R, Scala, Java, JavaScript, TypeScript, Swift, Rust, FORTRAN
TECHNOLOGIEN
Pytorch, Tensorflow, CUDA, MPI, numpy, scipy, matplotlib, xgboost, lightgbm, scikit-learn, keras, GPU, sqlite, Spark, pyspark, Datenbanken, PostgreSQL, MySQL, MariaDB, Oracle SQL, Greenplum, Microsoft SQL Server, SAP HANA, Teradata, Hadoop, Hive,NoSQL, Elastic Search, Data Lake, Data Warehouse, Docker, CI/CD, Continuous integration, Continuous delivery, Agile development, Airflow, Jenkins, Cloud, Amazon Web Services (AWS), Azure, S3, lambda, boto3, REST, flask, Django, API development, Algorithm development, Git, Version Control, HTML, CSS, full-stack developer, ETL, Bash, Shell, Terminal, low-level communication protocols, TCP/IP, TLS/SSL
Persönliche Daten
- Deutsch (Muttersprache)
- Englisch (Fließend)
- Chinesisch (Fließend)
- Europäische Union
Kontaktdaten
Nur registrierte PREMIUM-Mitglieder von freelance.de können Kontaktdaten einsehen.
Jetzt Mitglied werden